PREDIKSI STATUS PEROKOK DARI DATA TUBUH, HEMOGLOBIN, PENYAKIT GIGI MENGGUNAKAN RANDOM FOREST
DOI:
https://doi.org/10.61306/jnastek.v5i4.318Kata Kunci:
Prediksi Status Perokok, Random Forest, Machine LearningAbstrak
Perilaku merokok merupakan masalah kesehatan masyarakat yang serius karena berkaitan dengan berbagai penyakit kronis seperti gangguan paru, penyakit kardiovaskular, dan masalah kesehatan mulut. Oleh karena itu, memprediksi status perokok menjadi penting untuk mendukung strategi pencegahan yang berbasis data akurat. Penelitian ini bertujuan untuk memprediksi status perokok menggunakan empat variabel utama, yaitu tinggi badan, berat badan, kadar hemoglobin, dan penyakit gigi. Algoritma Random Forest dipilih karena memiliki kinerja yang kuat dalam menangani tugas klasifikasi yang kompleks. Dataset yang digunakan dalam penelitian ini berasal dari survei kesehatan masyarakat yang mencakup informasi antropometri dan medis terkait kebiasaan merokok. Sebelum membangun model, data melalui beberapa tahap pra-pemrosesan seperti normalisasi, penghapusan nilai yang hilang, dan pembagian data menjadi set pelatihan dan pengujian dengan rasio 80:20. Metode Grid Search digunakan untuk mengoptimalkan parameter model. Hasil penelitian menunjukkan bahwa model Random Forest mencapai akurasi sebesar 87%, dengan precision sebesar 0.85 dan recall sebesar 0.88. Kadar hemoglobin dan penyakit gigi ditemukan sebagai prediktor paling penting dalam menentukan status perokok, sementara berat badan menunjukkan hubungan moderat yang mengindikasikan adanya kaitan antara metabolisme dan konsumsi nikotin. Temuan ini menunjukkan bahwa Random Forest memberikan performa klasifikasi yang kuat dan stabil dalam konteks kesehatan masyarakat. Selain itu, analisis data eksploratori dan pengembangan model dilakukan menggunakan Google Collaboratory dengan bahasa pemrograman Python. Evaluasi model akhir menghasilkan akurasi 80,16%, yang menegaskan efektivitas Random Forest dalam mengidentifikasi pola perilaku merokok dalam dataset.
Unduhan
Referensi
Kementerian Kesehatan Republik Indonesia. (2023). Profil Kesehatan Indonesia 2023. Jakarta: Kemenkes RI.
WHO. (2022). Global Report on Trends in Prevalence of Tobacco Use 2000–2025 (5th ed.). World Health Organization.
Rahman, A., & Hasan, M. (2021). Implementation of Random Forest Algorithm for Health Data Classification. Journal of Data Science and Health Informatics, 5(2), 45–52.
Susanti, D., Arifin, R., & Hidayat, M. (2021). Preprocessing Techniques for Improving Accuracy in Machine Learning Health Data. Indonesian Journal of Computing and Informatics, 6(1), 33–40.
Putri, R., & Santosa, B. (2022). Optimization of Random Forest Parameters Using Grid Search for Health Classification Problems. Jurnal Teknologi Informasi dan Ilmu Komputer, 9(4), 589–598.
Nugroho, S., Dewi, A., & Syahputra, D. (2021). Correlation Between Body Mass Index and Smoking Behavior Among Adults in Indonesia. Jurnal Kesehatan Nasional, 15(3), 210–217.
Pratama, Y., & Lestari, N. (2022). Comparative Analysis of Machine Learning Algorithms for Health Risk Prediction. Jurnal Informatika dan Sains Data, 7(2), 124–133.
Yuliani, S., & Fadilah, R. (2023). Association of Dental Health and Smoking Habits in Indonesian Adults. Jurnal Kesehatan Gigi dan Mulut Indonesia, 12(1), 22–29.
Dutta, G. (2022). Smoker Status Prediction [Dataset]. Kaggle. Retrieved from https://www.kaggle.com/datasets/gauravduttakiit/smoker-status-prediction
Unduhan
Diterbitkan
Cara Mengutip
Terbitan
Bagian
Lisensi
Hak Cipta (c) 2025 Nayla Bella Rahmawati, Dimas, Fadly, Yamin, Ade

Artikel ini berlisensiCreative Commons Attribution-ShareAlike 4.0 International License.
HAK CIPTA
Hak cipta atas artikel apapun pada Jurnal Nasional Teknologi Komputer (JNASTEK) dipegang penuh oleh penulisnya dibawah lisensi Creative Commons Attribution-ShareAlike 4.0 International License.
1. Penulis mengakui bahwa Jurnal Nasional Teknologi Komputer (JNASTEK) berhak sebagai yang mempublikasikan pertama kali dengan lisensi Creative Commons Attribution-ShareAlike 4.0 International License - CC BY-SA.
2. Penulis dapat memasukan tulisan secara terpisah, mengatur distribusi non-ekskulif dari naskah yang telah terbit di jurnal ini kedalam versi yang lain (misal: dikirim ke respository institusi penulis, publikasi kedalam buku, dll), dengan mengakui bahwa naskah telah terbit pertama kali pada Jurnal Nasional Teknologi Komputer (JNASTEK).
LISENSI
Jurnal Nasional Teknologi Komputer (JNASTEK) diterbitkan berdasarkan ketentuan Creative Commons Attribution-ShareAlike 4.0 International License. Lisensi ini mengizinkan setiap orang untuk menyalin dan menyebarluaskan kembali materi ini dalam bentuk atau format apapun, menggubah, mengubah, dan membuat turunan dari materi ini untuk kepentingan apapun, termasuk kepentingan komersial, selama mereka mencantumkan kredit kepada Penulis atas ciptaan asli.














