Perbandingan Algoritma XGBoost dan CatBoost dalam Prediksi Harga Rumah Berdasarkan Data Perumahan di Jabodetabek
DOI:
https://doi.org/10.61306/jnastek.v6i1.345Kata Kunci:
Prediksi harga rumah, XGBoost, CatBoost, Machine Learning, Properti JabodetabekAbstrak
Penelitian ini bertujuan untuk membangun dan membandingkan model prediksi harga rumah di wilayah Jabodetabek menggunakan algoritma machine learning XGBoost dan CatBoost. Data yang digunakan merupakan data sekunder properti perumahan yang diperoleh dari situs real estat dan dataset publik dengan total 9.991 data. Variabel yang digunakan meliputi fitur numerik seperti luas tanah, luas bangunan, jumlah kamar, jumlah kamar mandi, garasi, dan usia bangunan, serta fitur kategorikal seperti lokasi, jenis sertifikat, kondisi bangunan, dan fasilitas. Variabel target dalam penelitian ini adalah harga rumah dalam satuan rupiah. Tahapan pra-pemrosesan data meliputi pembersihan data, konversi satuan dan format harga, penanganan nilai hilang menggunakan median, serta rekayasa fitur dengan mengekstraksi informasi kota dari lokasi properti. Dataset kemudian dibagi menjadi data latih dan data uji dengan rasio 80:20. Pada model XGBoost, dilakukan One-Hot Encoding untuk fitur kategorikal dan standardisasi fitur numerik, sedangkan CatBoost memanfaatkan kemampuan native dalam menangani fitur kategorikal. Kedua model menggunakan transformasi logaritmik pada variabel target. Hasil evaluasi menunjukkan bahwa CatBoost memiliki performa yang lebih unggul dibandingkan XGBoost. Model CatBoost menghasilkan nilai MAE sebesar Rp 126.169.305, RMSE sebesar Rp 212.418.771, dan R² sebesar 0,9907 pada data uji, sedangkan XGBoost menghasilkan MAE Rp 239.321.909, RMSE Rp 393.835.569, dan R² sebesar 0,9682. Distribusi error dan MAPE CatBoost juga lebih stabil, dengan 91,80% prediksi memiliki error di bawah 10% sebanyak 1.835 data, sedangkan MAPE XGBoost memiliki prediksi error di bawah 10% sebesar 72,59% dari total data uji, yaitu 1.451 data. Temuan ini menunjukkan bahwa CatBoost efektif untuk prediksi harga rumah, khususnya pada dataset dengan dominasi fitur kategorikal.
Unduhan
Referensi
A. F. Limas Ptr, M. M. Siregar, dan I. Daniel, “Analysis of Gradient Boosting, XGBoost, and CatBoost on Mobile Phone Classification,” Journal of Computer Networks, Architecture and High Performance Computing, vol. 6, no. 2, pp. 661–670, Apr. 2024.
M. R. P. Putra, S. Juwariyah, M. Ridwan, dan R. Marco, “Optimasi Prediksi Kelayakan Pinjaman dengan Teknik Resampling dan Algoritma Boosting,” Komputika: Jurnal Sistem Komputer, vol. 14, no. 1, pp. 41–51, Apr. 2025. doi: 10.34010/komputika.v14i2.15485.
S. N. Ruscikasani, R. R. N. Oktalivia, F. R. Putra, A. J. Wahidin, B. Rahmatullah, dan I. Kurniawati, “Prediksi Pembelian E-Commerce Menggunakan XGBoost Berbasis Perilaku Sesi Pengguna,” Journal of Artificial Intelligence and Digital Business (RIGGS), vol. 4, no. 4, pp. 5666–5672, 2025.
S. Aurahmana dan U. Mahmudah, “Prediksi Perilaku Konsumtif Remaja Menggunakan Algoritma CatBoost Berbasis Machine Learning,” Indonesian Journal on Data Science, vol. 3, no. 2, pp. 78–86, Nov. 2025.
A. F. Istianto, A. I. Hadiana, dan F. R. Umbara, “Prediksi Curah Hujan Menggunakan Metode Categorical Boosting (CatBoost),” JATI (Jurnal Mahasiswa Teknik Informatika), vol. 7, no. 4, pp. 2930–2937, Aug. 2023.
B. W. Sari dan D. Prabowo, “Analisis Perbandingan Prediksi Harga Rumah Dengan Random Forest, Gradient Boosting, dan XGBoost,” Intellect: Indonesian Journal of Innovation Learning and Technology, vol. 4, no. 1, pp. 42–51, Jun. 2025. doi: 10.57255/intellect.v4i1.1385.
C. P. Ananda, “Machine Learning untuk Prediksi Gaya Hidup Berdasarkan Socioeconomic Status (SES) Menggunakan Algoritma CatBoost: Studi Kasus Mahasiswa UIN Jakarta,” Skripsi, Program Studi Sistem Informasi, Fakultas Sains dan Teknologi, Universitas Islam Negeri Syarif Hidayatullah Jakarta, 2023.
F. H. Syahadah, R. T. Subagio, dan P. Rizqiyah, “Penerapan XGBoost dalam Prediksi Pendaftaran Siswa Baru Bimbingan Belajar QSC di Kota Cirebon,” JITET (Jurnal Informatika dan Teknik Elektro Terapan), vol. 13, no. 3S1, pp. 1082–1089, 2025. doi: 10.23960/jitet.v13i3S1.7998.
F. Madani dan A. H. Lubis, “CatBoost Algorithm Implementation for Classifying Women's Fashion Products,” JITE (Journal of Informatics and Telecommunication Engineering), vol. 9, no. 1, pp. 249–260, Jul. 2025. doi: 10.31289/jite.v9i1.15604.
A. Alaoui, et al., “A Comparative Study of Machine Learning Models for Real Estate Price Prediction,” International Journal of Advanced Computer Science and Applications, vol. 12, no. 4, pp. 215–222, 2021. doi: 10.14569/IJACSA.2021.0120427.
X. Chen dan Y. Zhang, “CatBoost for Real Estate Valuation: A Comparative Analysis,” Journal of Property Research, vol. 40, no. 2, pp. 145–163, Jun. 2023. doi: 10.1080/09599916.2023.2185432.
A. M. Siregar, et al., “Penerapan Machine Learning untuk Prediksi Harga Rumah di Wilayah Jakarta Selatan,” JKBTI (Jurnal Komputer, Bisnis dan Teknologi Informasi), vol. 4, no. 1, pp. 45–53, 2022.
R. Wijaya dan S. Pratama, “Comparative Analysis of Ensemble Methods for Housing Price Prediction in Surabaya,” IJIST (International Journal of Information Systems and Technology), vol. 7, no. 2, pp. 88–97, 2023.
M. B. S. Qolbi, T. N. Puteh, Rivandi, dan C. Rozikin, “Prediksi Harga Rumah di Jakarta Pusat Menggunakan Algoritma Machine Learning,” Jurnal Ilmu Komputer dan Bisnis (JIKB), vol. 16, no. 1, pp. 16–24, Mei 2025. doi: 10.47927/jikb.v16i1.840.
M. R. Fauzi, M. Handika, A. Awinanto, A. J. Wahidin, B. Rahmatullah, dan I. Kurniawati, “Analisis Perbandingan Kinerja Algoritma Linear Regression, Random Forest, dan XGBoost dalam Prediksi Harga Rumah,” Journal of Artificial Intelligence and Digital Business (RIGGS), vol. 4, no. 4, pp. 1541–1548, 2025.
M. G. A. Rianto, A. L. Prasasti, dan A. Novianty, “Implementasi Model XGBoost untuk Prediksi Jumlah Transaksi dan Total Pendapatan di Jaringan Restoran CV Balibul,” Jurnal Nasional SAINS dan TEKNIK, vol. 2, no. 2, pp. 43–46, 2024. doi: 10.25124/jnst.v2i2.8750.
Unduhan
Diterbitkan
Cara Mengutip
Terbitan
Bagian
Lisensi
Hak Cipta (c) 2026 Muh Agum Nur Efendi, Imam Suharjo

Artikel ini berlisensiCreative Commons Attribution-ShareAlike 4.0 International License.
HAK CIPTA
Hak cipta atas artikel apapun pada Jurnal Nasional Teknologi Komputer (JNASTEK) dipegang penuh oleh penulisnya dibawah lisensi Creative Commons Attribution-ShareAlike 4.0 International License.
1. Penulis mengakui bahwa Jurnal Nasional Teknologi Komputer (JNASTEK) berhak sebagai yang mempublikasikan pertama kali dengan lisensi Creative Commons Attribution-ShareAlike 4.0 International License - CC BY-SA.
2. Penulis dapat memasukan tulisan secara terpisah, mengatur distribusi non-ekskulif dari naskah yang telah terbit di jurnal ini kedalam versi yang lain (misal: dikirim ke respository institusi penulis, publikasi kedalam buku, dll), dengan mengakui bahwa naskah telah terbit pertama kali pada Jurnal Nasional Teknologi Komputer (JNASTEK).
LISENSI
Jurnal Nasional Teknologi Komputer (JNASTEK) diterbitkan berdasarkan ketentuan Creative Commons Attribution-ShareAlike 4.0 International License. Lisensi ini mengizinkan setiap orang untuk menyalin dan menyebarluaskan kembali materi ini dalam bentuk atau format apapun, menggubah, mengubah, dan membuat turunan dari materi ini untuk kepentingan apapun, termasuk kepentingan komersial, selama mereka mencantumkan kredit kepada Penulis atas ciptaan asli.














