Optimalisasi Kinerja Extreme Gradient Boosting melalui Grid Search untuk Prediksi Risiko Penyakit Jantung

Penulis

  • Tri Sugihartono Department Teknik Informatika, Fakultas Teknologi Informasi, ISB Atma Luhur, Indonesia
  • Marini Departemen Sistem Informasi, Fakultas Sistem Informasi, ISB Atma Luhur, Indonesia
  • Khoiril Irfan Department Teknik Informatika, Fakultas Teknologi Informasi, ISB Atma Luhur, Indonesia
  • Harrizki Arie Pradana Computer Science and Information Technology Faculty, UTHM, Malaysia

DOI:

https://doi.org/10.52436/1.jpti.1346

Kata Kunci:

Feature Importance, GridSearchCV, Heart Disease, Hyperparameter Tuning, Medical Prediction, XGBoost

Abstrak

Penyakit kardiovaskular merupakan salah satu penyebab utama kematian global, sehingga deteksi dini melalui sistem prediksi yang andal sangat krusial untuk memungkinkan intervensi medis yang tepat waktu dan efektif. Penelitian ini bertujuan untuk meningkatkan akurasi prediksi risiko penyakit jantung dengan mengoptimalkan model Extreme Gradient Boosting (XGBoost) melalui penyetelan hiperparameter yang sistematis. Pendekatan yang digunakan menggabungkan GridSearchCV dengan validasi silang 5-fold untuk menjelajahi ruang parameter secara komprehensif, dengan fokus pada optimasi metrik ROC AUC pada dataset medis berukuran besar (70.000 sampel). Hasil menunjukkan bahwa model yang telah dioptimalkan mencapai performa tinggi (Akurasi: 0,9930; ROC AUC: 0,9997). Meskipun perbedaan numerik terhadap model baseline (Akurasi: 0,9926; ROC AUC: 0,9996) relatif kecil, secara klinis perbaikan ini bermakna signifikan—terutama karena mengurangi jumlah false negatives sebanyak 1,2 kasus, yang berpotensi menyelamatkan nyawa melalui deteksi dini yang lebih akurat. Analisis feature importance mengidentifikasi tekanan darah tinggi, usia, dan diabetes sebagai prediktor utama risiko penyakit jantung. Temuan ini menegaskan bahwa pendekatan penyetelan hiperparameter yang terstruktur dapat memberikan dampak material dalam konteks prediksi medis berbasis data tabular. Penelitian ini memberikan kontribusi pada bidang data mining medis dengan menunjukkan efektivitas hyperparameter tuning untuk meningkatkan sistem prediksi penyakit kardiovaskular.

Unduhan

Data unduhan belum tersedia.

Referensi

R. R. Aulia, F. H. Lubis, and L. S. Harahap, “Penerapan Multi-Layer Perceptron untuk Prediksi Durasi Tidur Berdasarkan Faktor Kebiasaan Harian,” Journal of Multidisciplinary Inquiry in Science Technology and Educational Research, vol. 2, no. 1, pp. 20–30, 2025, doi: 10.32672/mister.v2i1.2326.

U. A. Syam, I. Irdayanti, I. Magfirrah, B. Sartono, and A. R. Firdawanti, “Evaluasi Kinerja Model Random Forest dan LightGBM untuk Klasifikasi Status Imunisasi Hepatitis B (HB-0) pada Balita,” Euler?: Jurnal Ilmiah Matematika, Sains dan Teknologi, vol. 13, no. 1, pp. 1–8, Apr. 2025, doi: 10.37905/euler.v13i1.29762.

F. V. Ongkosianbhadra and C. C. Lestari, “Pengembangan Model Prediksi Risiko Hipertensi Menggunakan Algoritma Gradient Boosting Decision Tree Yang Dioptimalkan,” Jurnal Informatika dan Sistem Informasi, vol. 9, no. 2, pp. 90–99, Dec. 2023, doi: 10.37715/juisi.v9i2.4403.

G. Abdurrahman, H. Oktavianto, and M. Sintawati, “Optimasi Algoritma XGBoost Classifier Menggunakan Hyperparameter Gridesearch dan Random Search Pada Klasifikasi Penyakit Diabetes,”, Informatics Journal, vol. 7, no. 3, 2022, doi : https://doi.org/10.19184/isj.v7i3.35441.

V. Marcella Angela Simalango and W. Franciska Senjaya, “Evaluasi Algoritma Decision Tree dan Random Forest serta Efektivitas Feature Selection dalam Memprediksi Kesehatan Mental,”, Jurnal Strategi, vol 7 no. 1, 2025.

“Implementasi Data Mining Dalam Melakukan Prediksi Penyakit Diabetes Menggunakan Metode Random Forest Dan Xgboost,” Jurnal Ilmiah Komputasi, vol. 23, no. 1, Mar. 2024, doi: 10.32409/jikstik.23.1.3507.

S. Handayani, D. Toresa, T. Informatika, F. Ilmu Komputer, and U. Lancang Kuning, “Peningkatan Performa Model Gradient Boosting dalam Klasifikasi Stroke Melalui Optimasi Grid Search”, Jurnal Teknologi Informasi dan Ilmu Komputer, vol. 14, no.3, 2024, doi: https://doi.org/10.37859/jf.v14i3.7893

M. RoisS, “PERBANDINGAN KINERJA SUPPORT VECTOR MACHINE DALAM KLASIFIKASI OBESITAS DENGAN PENDEKATAN KERNEL LINEAR DAN RADIAL BASIS FUNCTION,” JURNAL DEVICE, vol. 15, no. 1, pp. 14–23, 2025.

S. Mujiyono, U. P. Sanjaya, I. S. Wibisono, and H. Setyowati, “Prediksi Fluktuasi Berat Badan Berdasarkan Pola Hidup Menggunakan Model XGBoost dan Deep Learning,” Jurnal Algoritma, vol. 22, no. 1, pp. 221–233, May 2025, doi: 10.33364/algoritma/v.22-1.2253.

H. Karmila and S. Yuliyatini, “SYSTEMATIC LITERATURE REVIEW: EFFECTIVE DATA NORMALIZATION METHOD IN DETECTING DIABETES USING MACHINE LEARNING (K-NEAREST NEIGHBORS ALGORITHM) SYSTEMATIC LITERATURE REVIEW: METODE NORMALISASI DATA YANG EFEKTIF PADA DETEKSI PENYAKIT DIABETES MENGGUNAKAN MACHINE LEARNING (ALGORITMA K-NEAREST NEIGHBORS),” Journal of Scientech Research and Development, vol. 6, no. 1, 2024, [Online]. Available: https://idm.or.id/JSCR/inde

A. Muliawati and H. Nurramdhani Irmanda, “Penerapan Borderline-SMOTE dan Grid Search pada Bagging-SVM untuk Klasifikasi Penyakit Diabetes,” , Prosiding Seminar Nasional Mahasiswa Bidang Ilmu Komputer dan Aplikasi, 2022.

M. A. Saputra and T. Sugihartono, “Evaluasi Kinerja Model LSTM Untuk Prediksi Risiko Penyakit Jantung Menggunakan Dataset,” Jurnal Pendidikan dan Teknologi Indonesia, vol. 5, no. 7, pp. 1823–1833, Jul. 2025, doi: 10.52436/1.jpti.821.

A. Faqih and T. Sugihartono, “Perbandingan Algoritma XGBoost dan LSTM dalam Prediksi Harga Saham Tesla Menggunakan Data Tahun 2025,” Jurnal Pendidikan dan Teknologi Indonesia, vol. 5, no. 6, pp. 1563–1573, Jun. 2025, doi: 10.52436/1.jpti.836.

##submission.downloads##

Diterbitkan

2025-11-30

Cara Mengutip

Sugihartono, T., Marini, M., Irfan, K., & Pradana, H. A. (2025). Optimalisasi Kinerja Extreme Gradient Boosting melalui Grid Search untuk Prediksi Risiko Penyakit Jantung. Jurnal Pendidikan Dan Teknologi Indonesia, 5(10), 3074-3084. https://doi.org/10.52436/1.jpti.1346