KLASIFIKASI FAKTOR RISIKO PENYAKIT JANTUNG MENGGUNAKAN MACHINE LEARNING
CLASSIFICATION OF HEART DISEASE RISK FACTORS USING MACHINE LEARNING
DOI:
https://doi.org/10.52972/hoaq.vol16no1.p68-78Keywords:
penyakit jantung, klasifikasi, machine learning, seleksi fitur, Support Vector MachineAbstract
Penyakit jantung merupakan salah satu penyebab utama kematian di seluruh dunia, termasuk di Indonesia. Deteksi dini terhadap risiko penyakit jantung sangat penting untuk mencegah komplikasi serius namun tantangan utama yang dihadapi adalah deteksi dini penyakit ini sering terlambat karena proses klasifikasinya belum cukup akurat. Penelitian ini bertujuan membangun model klasifikasi risiko penyakit jantung dengan pendekatan machine learning. Dataset yang digunakan berasal dari Kaggle, terdiri dari 920 data pasien dengan 13 fitur medis yang relevan. Proses penelitian meliputi pra-pemrosesan data, seleksi fitur menggunakan metode Recursive Feature Elimination (RFE), pelatihan model dengan enam algoritma (Random Forest, Support Vector Machine, K-Nearest Neighbors, Naive Bayes, Decision Tree, dan Logistic Regression), serta evaluasi kinerja model menggunakan metrik akurasi, precision, recall, f1-score, ROC-AUC, dan analisis tingkat kepentingan fitur. Hasil penelitian menunjukkan bahwa algoritma Support Vector Machine (SVM) memberikan performa terbaik dengan akurasi sebesar 83,91% dan AUC sebesar 0,92, diikuti oleh Random Forest dengan akurasi 82,61%. Fitur yang paling berkontribusi terhadap hasil klasifikasi adalah tipe nyeri dada (cp), jumlah pembuluh darah utama (ca), dan jenis talasemia (thal). Temuan ini menunjukkan bahwa penerapan machine learning dengan seleksi fitur yang tepat dapat meningkatkan akurasi klasifikasi risiko penyakit jantung dan berpotensi digunakan sebagai sistem pendukung keputusan dalam dunia medis.
Heart disease is one of the leading causes of death worldwide, including in Indonesia. Early detection of heart disease risk is very important to prevent serious complications but the main challenge faced is that early detection of this disease is often late because the classification process is not accurate enough. This study aims to build a heart disease risk classification model with a machine learning approach. The dataset used comes from Kaggle, consisting of 920 patient data with 13 relevant medical features. The research process includes data pre-processing, feature selection using the Recursive Feature Elimination (RFE) method, model training with six algorithms (Random Forest, Support Vector Machine, K-Nearest Neighbors, Naive Bayes, Decision Tree, and Logistic Regression), and model performance evaluation using accuracy, precision, recall, f1-score, ROC-AUC metrics, and feature importance analysis. The results showed that the Support Vector Machine (SVM) algorithm provided the best performance with an accuracy of 83.91% and AUC of 0.92, followed by Random Forest with an accuracy of 82.61%. The features that contributed most to the classification results were chest pain type (cp), number of major blood vessels (ca), and thalassemia type (thal). These findings suggest that the application of machine learning with appropriate feature selection can improve the accuracy of heart disease risk classification and has the potential to be used as a decision support system in the medical world.
References
World Health Organization (WHO), “Cardiovascular diseases,” World Health Organization (WHO). Accessed: May 22, 2025. [Online]. Available: https://www.who.int/health-topics/cardiovascular-diseases#tab=tab_1
M. Sani, “Menkes: Stroke dan Jantung Jadi Penyebab 1,5 Juta Kematian per Tahun di Indonesia,” Marwah Kepri.com. Accessed: May 22, 2025. [Online]. Available: https://marwahkepri.com/2025/01/17/menkes-stroke-dan-jantung-jadi-penyebab-15-juta-kematian-per-tahun-di-indonesia/
R. Antika, A. Rifa, F. Dikananda, D. Indriya Efendi, and R. Narasati, “Penerapan Algoritma Decision Tree Berbasis Pohon Keputusan Dalam Klasifikasi Penyakit Jantung,” Jurnal Mahasiswa Teknik Informatika, vol. 7, no. 6, 2023, doi: https://doi.org/10.36040/jati.v7i6.8264.
D. Fabiyanto and Z. Pratama Putra, “Validasi Efektivitas Logistic Regression untuk Diagnosa Penyakit Jantung melalui Pendekatan Machine Learning,” Jurnal Ilmiah FIFO, vol. 16, no. 2, p. 158, Nov. 2024, doi: 10.22441/fifo.2024.v16i2.006.
A. Dewi, A. Safira Surya, and Y. Yamasari, “Penerapan Algoritma Naïve Bayes (NB) untuk Klasifikasi Penyakit Jantung,” Journal of Informatics and Computer Science, vol. 5, No. 3, pp. 447-445, 2024, doi: 10.26740/jinacs.v5n3.447.
S. N. Nuraini Arif, A. Mutoi Siregar, S. Faisal, and A. Ratna Juwita, “Klasifikasi Penyakit Serangan Jantung Menggunakan Metode Machine Learning K-Nearest Neighbors (KNN) dan Support Vector Machine (SVM),” Jurnal Media Informatika Budidarma , vol. 8, no. 3, pp. 1617–1626, Jul. 2024, doi: 10.30865/mib.v8i3.7844.
A. Carolina Wibowo, S. Ardi Lestari, and Nurchim, “Analisis Penggunaan Machine Learning Dalam Klasifikasi Penentuan Penyakit Jantung ,” Jurnal Sistem Informasi dan Teknik Komputer, vol. 9, no. 2, p. 395, 2024, doi: https://doi.org/10.51876/simtek.v9i2.395.
M. Napiah and S. Heristian, “Perbandingan Algoritma Machine Learning pada Klasifikasi Penyakit Jantung,” Jurnal Infortech, vol. 6, no. 1, p. 21888, Jun. 2024, doi: 10.31294/infortech.v6i1.21888.
Ratnasari, A. Jurnaidi Wahidin, A. Eko Setiawan, and P. Bintoro, “Machine Learning Untuk Klasifikasi Penyakit Jantung,” Aisyah Journal of Informatics and Electrical Engineering, vol. 6, no. 1, 2024, doi: https://doi.org/10.30604/jti.v6i1.272.
S. Muhammad Abdullah, “Heart Disease Dataset | Cleaned,” Kaggle. Accessed: May 22, 2025. [Online]. Available: https://www.kaggle.com/datasets/abdmental01/heart-disease-dataset
M. Anita, I. G. Dwi Yulianti, and S. Varestama Pasaribu, “Projectrti,” 2025. Accessed: Jun. 11, 2025. [Online]. Available: https://github.com/Nicholaslorenzo/projectrti.git
A. Rahmada and E. Redy Susanto, “Peningkatan Akurasi Prediksi Penyakit Jantung dengan Teknik SMOTEENN pada Algoritma Random Forest,” Jurnal Pendidikan dan Teknologi Indonesia(JPTI), vol. 4, no. 12, pp. 795–803, Dec. 2024, doi: https://doi.org/10.52436/1.jpti.524.
D. Setiawan, A. Muhammad, and S. H. Fransiska Dewi, “Penerapan Algoritma Klasifikasi untuk Deteksi Dini Penyakit Jantung Koroner Berdasarkan Gejala Klinis ,” Teknik: Jurnal Ilmu Teknik dan Informatika, vol. 5, no. 1, pp. 18–26, May 2025, doi: 10.30605/onoma.v9i2.2961.
I. Sabily Karima, “Penerapan Machine Learning untuk memprediksi Resiko Pengidap Penyakit Jantung menggunakan Algoritma decision tree,” Joglo, Kec. Kembangan, vol. 14(1), no. 1, pp. 73–81, 2025, doi: http://dx.doi.org/10.22441/format.2025.v14.i1.007.
Downloads
Published
How to Cite
Issue
Section
License
Copyright (c) 2025 HOAQ (High Education of Organization Archive Quality) : Jurnal Teknologi Informasi

This work is licensed under a Creative Commons Attribution 4.0 International License.
Jurnal HOAQ (High Education of Organization Archive Quality) : Jurnal Teknologi Informasi diterbitkan berdasarkan lisensi Creative Commons Attribution 4.0 International License (CC BY 4.0). Lisensi ini memungkinkan setiap orang untuk Berbagi: menyalin dan mendistribusikan kembali materi ini dalam format atau bentuk apapun; Adaptasi: merombak, mengubah, dan membuat turunan dari materi ini untuk keperluan apa pun, termasuk keperluan komersial, asalkan mereka memberikan pengakuan kepada Penulis Asli atas hasil karya aslinya.











