PREDIKSI STATUS PEROKOK DARI DATA TUBUH, HEMOGLOBIN, PENYAKIT GIGI MENGGUNAKAN RANDOM FOREST

Penulis

  • Nayla Bella Rahmawati indiviadu
  • Dimas Universitas Bina Sarana Informatika
  • Fadly Universitas Bina Sarana Informatika
  • Yamin Universitas Bina Sarana Informatika
  • Ade Universitas Bina Sarana Informatika

DOI:

https://doi.org/10.61306/jnastek.v5i4.318

Kata Kunci:

Prediksi Status Perokok, Random Forest, Machine Learning

Abstrak

Perilaku merokok merupakan masalah kesehatan masyarakat yang serius karena berkaitan dengan berbagai penyakit kronis seperti gangguan paru, penyakit kardiovaskular, dan masalah kesehatan mulut. Oleh karena itu, memprediksi status perokok menjadi penting untuk mendukung strategi pencegahan yang berbasis data akurat. Penelitian ini bertujuan untuk memprediksi status perokok menggunakan empat variabel utama, yaitu tinggi badan, berat badan, kadar hemoglobin, dan penyakit gigi. Algoritma Random Forest dipilih karena memiliki kinerja yang kuat dalam menangani tugas klasifikasi yang kompleks. Dataset yang digunakan dalam penelitian ini berasal dari survei kesehatan masyarakat yang mencakup informasi antropometri dan medis terkait kebiasaan merokok. Sebelum membangun model, data melalui beberapa tahap pra-pemrosesan seperti normalisasi, penghapusan nilai yang hilang, dan pembagian data menjadi set pelatihan dan pengujian dengan rasio 80:20. Metode Grid Search digunakan untuk mengoptimalkan parameter model. Hasil penelitian menunjukkan bahwa model Random Forest mencapai akurasi sebesar 87%, dengan precision sebesar 0.85 dan recall sebesar 0.88. Kadar hemoglobin dan penyakit gigi ditemukan sebagai prediktor paling penting dalam menentukan status perokok, sementara berat badan menunjukkan hubungan moderat yang mengindikasikan adanya kaitan antara metabolisme dan konsumsi nikotin. Temuan ini menunjukkan bahwa Random Forest memberikan performa klasifikasi yang kuat dan stabil dalam konteks kesehatan masyarakat. Selain itu, analisis data eksploratori dan pengembangan model dilakukan menggunakan Google Collaboratory dengan bahasa pemrograman Python. Evaluasi model akhir menghasilkan akurasi 80,16%, yang menegaskan efektivitas Random Forest dalam mengidentifikasi pola perilaku merokok dalam dataset.

Unduhan

Data unduhan belum tersedia.

Referensi

Kementerian Kesehatan Republik Indonesia. (2023). Profil Kesehatan Indonesia 2023. Jakarta: Kemenkes RI.

WHO. (2022). Global Report on Trends in Prevalence of Tobacco Use 2000–2025 (5th ed.). World Health Organization.

Rahman, A., & Hasan, M. (2021). Implementation of Random Forest Algorithm for Health Data Classification. Journal of Data Science and Health Informatics, 5(2), 45–52.

Susanti, D., Arifin, R., & Hidayat, M. (2021). Preprocessing Techniques for Improving Accuracy in Machine Learning Health Data. Indonesian Journal of Computing and Informatics, 6(1), 33–40.

Putri, R., & Santosa, B. (2022). Optimization of Random Forest Parameters Using Grid Search for Health Classification Problems. Jurnal Teknologi Informasi dan Ilmu Komputer, 9(4), 589–598.

Nugroho, S., Dewi, A., & Syahputra, D. (2021). Correlation Between Body Mass Index and Smoking Behavior Among Adults in Indonesia. Jurnal Kesehatan Nasional, 15(3), 210–217.

Pratama, Y., & Lestari, N. (2022). Comparative Analysis of Machine Learning Algorithms for Health Risk Prediction. Jurnal Informatika dan Sains Data, 7(2), 124–133.

Yuliani, S., & Fadilah, R. (2023). Association of Dental Health and Smoking Habits in Indonesian Adults. Jurnal Kesehatan Gigi dan Mulut Indonesia, 12(1), 22–29.

Dutta, G. (2022). Smoker Status Prediction [Dataset]. Kaggle. Retrieved from https://www.kaggle.com/datasets/gauravduttakiit/smoker-status-prediction

Unduhan

Diterbitkan

05-12-2025

Cara Mengutip

Bella Rahmawati, N., Permadi, D., Fadly, M., Nur Yamin, Y., & Priyatna , A. (2025). PREDIKSI STATUS PEROKOK DARI DATA TUBUH, HEMOGLOBIN, PENYAKIT GIGI MENGGUNAKAN RANDOM FOREST. Jurnal Nasional Teknologi Komputer, 5(4), 1075–1082. https://doi.org/10.61306/jnastek.v5i4.318

Terbitan

Bagian

Artikel