Perbandingan Algoritma XGBoost dan CatBoost dalam Prediksi Harga Rumah Berdasarkan Data Perumahan di Jabodetabek

Penulis

  • Muh Agum Nur Efendi Universitas Mercu Buana Yogyakarta
  • Imam Suharjo Universitas Mercu Buana Yogyakarta

DOI:

https://doi.org/10.61306/jnastek.v6i1.345

Kata Kunci:

Prediksi harga rumah, XGBoost, CatBoost, Machine Learning, Properti Jabodetabek

Abstrak

Penelitian ini bertujuan untuk membangun dan membandingkan model prediksi harga rumah di wilayah Jabodetabek menggunakan algoritma machine learning XGBoost dan CatBoost. Data yang digunakan merupakan data sekunder properti perumahan yang diperoleh dari situs real estat dan dataset publik dengan total 9.991 data. Variabel yang digunakan meliputi fitur numerik seperti luas tanah, luas bangunan, jumlah kamar, jumlah kamar mandi, garasi, dan usia bangunan, serta fitur kategorikal seperti lokasi, jenis sertifikat, kondisi bangunan, dan fasilitas. Variabel target dalam penelitian ini adalah harga rumah dalam satuan rupiah. Tahapan pra-pemrosesan data meliputi pembersihan data, konversi satuan dan format harga, penanganan nilai hilang menggunakan median, serta rekayasa fitur dengan mengekstraksi informasi kota dari lokasi properti. Dataset kemudian dibagi menjadi data latih dan data uji dengan rasio 80:20. Pada model XGBoost, dilakukan One-Hot Encoding untuk fitur kategorikal dan standardisasi fitur numerik, sedangkan CatBoost memanfaatkan kemampuan native dalam menangani fitur kategorikal. Kedua model menggunakan transformasi logaritmik pada variabel target. Hasil evaluasi menunjukkan bahwa CatBoost memiliki performa yang lebih unggul dibandingkan XGBoost. Model CatBoost menghasilkan nilai MAE sebesar Rp 126.169.305, RMSE sebesar Rp 212.418.771, dan R² sebesar 0,9907 pada data uji, sedangkan XGBoost menghasilkan MAE Rp 239.321.909, RMSE Rp 393.835.569, dan R² sebesar 0,9682. Distribusi error dan MAPE CatBoost juga lebih stabil, dengan 91,80% prediksi memiliki error di bawah 10% sebanyak 1.835 data, sedangkan MAPE XGBoost memiliki prediksi error di bawah 10% sebesar 72,59% dari total data uji, yaitu 1.451 data. Temuan ini menunjukkan bahwa CatBoost efektif untuk prediksi harga rumah, khususnya pada dataset dengan dominasi fitur kategorikal.

Unduhan

Data unduhan belum tersedia.

Referensi

A. F. Limas Ptr, M. M. Siregar, dan I. Daniel, “Analysis of Gradient Boosting, XGBoost, and CatBoost on Mobile Phone Classification,” Journal of Computer Networks, Architecture and High Performance Computing, vol. 6, no. 2, pp. 661–670, Apr. 2024.

M. R. P. Putra, S. Juwariyah, M. Ridwan, dan R. Marco, “Optimasi Prediksi Kelayakan Pinjaman dengan Teknik Resampling dan Algoritma Boosting,” Komputika: Jurnal Sistem Komputer, vol. 14, no. 1, pp. 41–51, Apr. 2025. doi: 10.34010/komputika.v14i2.15485.

S. N. Ruscikasani, R. R. N. Oktalivia, F. R. Putra, A. J. Wahidin, B. Rahmatullah, dan I. Kurniawati, “Prediksi Pembelian E-Commerce Menggunakan XGBoost Berbasis Perilaku Sesi Pengguna,” Journal of Artificial Intelligence and Digital Business (RIGGS), vol. 4, no. 4, pp. 5666–5672, 2025.

S. Aurahmana dan U. Mahmudah, “Prediksi Perilaku Konsumtif Remaja Menggunakan Algoritma CatBoost Berbasis Machine Learning,” Indonesian Journal on Data Science, vol. 3, no. 2, pp. 78–86, Nov. 2025.

A. F. Istianto, A. I. Hadiana, dan F. R. Umbara, “Prediksi Curah Hujan Menggunakan Metode Categorical Boosting (CatBoost),” JATI (Jurnal Mahasiswa Teknik Informatika), vol. 7, no. 4, pp. 2930–2937, Aug. 2023.

B. W. Sari dan D. Prabowo, “Analisis Perbandingan Prediksi Harga Rumah Dengan Random Forest, Gradient Boosting, dan XGBoost,” Intellect: Indonesian Journal of Innovation Learning and Technology, vol. 4, no. 1, pp. 42–51, Jun. 2025. doi: 10.57255/intellect.v4i1.1385.

C. P. Ananda, “Machine Learning untuk Prediksi Gaya Hidup Berdasarkan Socioeconomic Status (SES) Menggunakan Algoritma CatBoost: Studi Kasus Mahasiswa UIN Jakarta,” Skripsi, Program Studi Sistem Informasi, Fakultas Sains dan Teknologi, Universitas Islam Negeri Syarif Hidayatullah Jakarta, 2023.

F. H. Syahadah, R. T. Subagio, dan P. Rizqiyah, “Penerapan XGBoost dalam Prediksi Pendaftaran Siswa Baru Bimbingan Belajar QSC di Kota Cirebon,” JITET (Jurnal Informatika dan Teknik Elektro Terapan), vol. 13, no. 3S1, pp. 1082–1089, 2025. doi: 10.23960/jitet.v13i3S1.7998.

F. Madani dan A. H. Lubis, “CatBoost Algorithm Implementation for Classifying Women's Fashion Products,” JITE (Journal of Informatics and Telecommunication Engineering), vol. 9, no. 1, pp. 249–260, Jul. 2025. doi: 10.31289/jite.v9i1.15604.

A. Alaoui, et al., “A Comparative Study of Machine Learning Models for Real Estate Price Prediction,” International Journal of Advanced Computer Science and Applications, vol. 12, no. 4, pp. 215–222, 2021. doi: 10.14569/IJACSA.2021.0120427.

X. Chen dan Y. Zhang, “CatBoost for Real Estate Valuation: A Comparative Analysis,” Journal of Property Research, vol. 40, no. 2, pp. 145–163, Jun. 2023. doi: 10.1080/09599916.2023.2185432.

A. M. Siregar, et al., “Penerapan Machine Learning untuk Prediksi Harga Rumah di Wilayah Jakarta Selatan,” JKBTI (Jurnal Komputer, Bisnis dan Teknologi Informasi), vol. 4, no. 1, pp. 45–53, 2022.

R. Wijaya dan S. Pratama, “Comparative Analysis of Ensemble Methods for Housing Price Prediction in Surabaya,” IJIST (International Journal of Information Systems and Technology), vol. 7, no. 2, pp. 88–97, 2023.

M. B. S. Qolbi, T. N. Puteh, Rivandi, dan C. Rozikin, “Prediksi Harga Rumah di Jakarta Pusat Menggunakan Algoritma Machine Learning,” Jurnal Ilmu Komputer dan Bisnis (JIKB), vol. 16, no. 1, pp. 16–24, Mei 2025. doi: 10.47927/jikb.v16i1.840.

M. R. Fauzi, M. Handika, A. Awinanto, A. J. Wahidin, B. Rahmatullah, dan I. Kurniawati, “Analisis Perbandingan Kinerja Algoritma Linear Regression, Random Forest, dan XGBoost dalam Prediksi Harga Rumah,” Journal of Artificial Intelligence and Digital Business (RIGGS), vol. 4, no. 4, pp. 1541–1548, 2025.

M. G. A. Rianto, A. L. Prasasti, dan A. Novianty, “Implementasi Model XGBoost untuk Prediksi Jumlah Transaksi dan Total Pendapatan di Jaringan Restoran CV Balibul,” Jurnal Nasional SAINS dan TEKNIK, vol. 2, no. 2, pp. 43–46, 2024. doi: 10.25124/jnst.v2i2.8750.

Unduhan

Diterbitkan

27-01-2026

Cara Mengutip

Efendi, M. A. N., & Suharjo, I. (2026). Perbandingan Algoritma XGBoost dan CatBoost dalam Prediksi Harga Rumah Berdasarkan Data Perumahan di Jabodetabek. Jurnal Nasional Teknologi Komputer, 6(1), 51–63. https://doi.org/10.61306/jnastek.v6i1.345

Terbitan

Bagian

Artikel