Klasifikasi Risiko Diabetes Menggunakan Support Vector Machine Berbasis Feature Selection dan Hyperparameter Tuning

Authors

  • Nova Ariansyah Universitas Multi Data Palembang
  • Dedy Hermanto Universitas Multi Data Palembang

DOI:

https://doi.org/10.30606/rjti.v5i1.4301

Keywords:

Diabetes Mellitus, Support Vector Machine, Feature Selection, Hyperparameter Tuning, Classification

Abstract

Diabetes Mellitus merupakan penyakit metabolik kronis dengan prevalensi yang terus meningkat secara global. Deteksi dini risiko diabetes menjadi langkah strategis untuk mencegah komplikasi serius seperti penyakit kardiovaskular dan gagal ginjal. Penelitian ini bertujuan mengimplementasikan algoritma Support Vector Machine (SVM) dalam klasifikasi risiko diabetes serta menganalisis pengaruh Feature Selection dan Hyperparameter Tuning  terhadap kinerja model. Dataset yang digunakan berjumlah 100.000 data pasien yang diperoleh dari Kaggle  dengan distribusi kelas yang tidak seimbang antara pasien diabetes dan non-diabetes. Preprocessing dilakukan menggunakan Min-Max Normalization. Seleksi fitur diterapkan menggunakan metode ReliefF dan Mutual Information. Evaluasi model menggunakan 10-Fold Cross Validation untuk meminimalkan bias estimasi performa. Hyperparameter Tuning  dilakukan menggunakan Optuna dengan optimasi parameter C, gamma, dan degree pada kernel Polynomial dan Radial Basis Function. Hasil eksperimen menunjukkan bahwa Hyperparameter Tuning  meningkatkan recall kelas Diabetes dari 0,67 menjadi 0,94 serta meningkatkan akurasi keseluruhan dari 94,76% menjadi 98,90%. Jumlah false negative menurun dari 4.851 menjadi 915 kasus. Temuan ini menunjukkan bahwa optimasi parameter dan seleksi fitur berperan penting dalam meningkatkan sensitivitas model terhadap kelas minoritas pada dataset medis yang tidak seimbang.

Downloads

Download data is not yet available.

References

I. D. A. E. C. Astutisari, A. Y. D. AAA Yuliati Darmini, and I. A. P. W. Ida Ayu Putri Wulandari, “Hubungan Pola Makan Dan Aktivitas Fisik Dengan Kadar Gula Darah Pada Pasien Diabetes Melitus Tipe 2 Di Puskesmas Manggis I,†Jurnal Riset Kesehatan Nasional, vol. 6, no. 2, pp. 79–87, Oct. 2022, doi: 10.37294/jrkn.v6i2.350.

S. Chen, G. I. Webb, L. Liu, and X. Ma, “A novel selective naïve Bayes algorithm,†Knowl Based Syst, vol. 192, p. 105361, Mar. 2020, doi: 10.1016/j.knosys.2019.105361.

D. A. Pisner and D. M. Schnyer, “Support Vector Machine,†in Machine Learning, Elsevier, 2020, pp. 101–121. doi: 10.1016/B978-0-12-815739-8.00006-7.

J. N.P. and R. Aruna, “Big data analytics in health care by data mining and classification techniques,†ICT Express, vol. 8, no. 2, pp. 250–257, Jun. 2022, doi: 10.1016/j.icte.2021.07.001.

H. Apriyani and K. Kurniati, “Perbandingan Metode Naïve Bayes Dan Support Vector Machine Dalam Klasifikasi Penyakit Diabetes Melitus,†Journal of Information Technology Ampera, vol. 1, no. 3, pp. 133–143, Dec. 2020, doi: 10.51519/journalita.volume1.isssue3.year2020.page133-143.

A. S. Munir, A. B. Saputra, A. Aziz, and M. A. Barata, “Perbandingan Akurasi Algoritma Naive Bayes dan Algoritma Decision Tree dalam Pengklasifikasian Penyakit Kanker Payudara,†Jurnal Ilmiah Informatika Global, vol. 15, no. 1, pp. 23–29, Apr. 2024, doi: 10.36982/jiig.v15i1.3578.

H. Fathurahman, A. Ariwikri, G. A. Pratama, M. A. F. S. FIKRI, and M. F. ALRIZKI, “PERBANDINGAN AKURASI METODE NAIVE BAYES CLASSIFIER DAN RANDOM FOREST MENGGUNAKAN REDUKSI DIMENSI LINEAR DICRIMINANT ANALYSIS (LDA) UNTUK DIAGNOSIS PENYAKIT DIABETES,†Jurnal Rekayasa Elektro Sriwijaya, vol. 4, no. 1, pp. 24–31, Jan. 2023, doi: 10.36706/jres.v4i1.58.

E. Ramon, A. Nazir, N. Novriyanto, Y. Yusra, and L. Oktavia, “KLASIFIKASI STATUS GIZI BAYI POSYANDU KECAMATAN BANGUN PURBA MENGGUNAKAN ALGORITMA SUPPORT VECTOR MACHINE (SVM),†Jurnal Sistem Informasi dan Informatika (Simika), vol. 5, no. 2, pp. 143–150, Aug. 2022, doi: 10.47080/simika.v5i2.2185.

P. H. Prastyo, A. S. Sumi, A. W. Dian, and A. E. Permanasari, “Tweets Responding to the Indonesian Government’s Handling of COVID-19: Sentiment Analysis Using SVM with Normalized Poly Kernel,†Journal of Information Systems Engineering and Business Intelligence, vol. 6, no. 2, p. 112, Oct. 2020, doi: 10.20473/jisebi.6.2.112-122.

Y. Harni, I. Afrianty, S. Sanjaya, R. Abdillah, F. Yanto, and F. Syafria, “Performance Analysis of LVQ 1 Using Feature Selection Gain Ratio for Sex Classification in Forensic Anthropology,†Building of Informatics, Technology and Science (BITS), vol. 5, no. 1, Jun. 2023, doi: 10.47065/bits.v5i1.3625.

Aswin Ardiansyah, Enos C.O.Telaumbanua, Aron S. Gultom, and Angelita A. S. M. Limbong, “Klasifikasi Penyakit Diabetes Menggunakan Metode SVM Dan KNN,†Jurnal Penelitian Rumpun Ilmu Teknik, vol. 3, no. 1, pp. 77–83, Dec. 2023, doi: 10.55606/juprit.v3i1.3151.

I. Afrianty, D. Nasien, and H. Haron, “Performance Analysis of Support Vector Machine in Sex Classification of The Sacrum Bone in Forensic Anthropology,†JURNAL TEKNIK INFORMATIKA, vol. 15, no. 1, pp. 63–72, Jun. 2022, doi: 10.15408/jti.v15i1.25254.

R. Islam, A. Sultana, Md. N. Tuhin, Md. S. H. Saikat, and M. R. Islam, “Clinical Decision Support System for Diabetic Patients by Predicting Type 2 Diabetes Using Machine learning Algorithms,†J Healthc Eng, vol. 2023, no. 1, Jan. 2023, doi: 10.1155/2023/6992441.

N. Aggarwal et al., “Mean based relief: An improved Feature Selection method based on ReliefF,†Applied Intelligence, vol. 53, no. 19, pp. 23004–23028, Oct. 2023, doi: 10.1007/s10489-023-04662-w.

L. Silalahi, “Hubungan Pengetahuan dan Tindakan Pencegahan Diabetes Mellitus Tipe 2,†Jurnal PROMKES, vol. 7, no. 2, p. 223, Dec. 2019, doi: 10.20473/jpk.v7.i2.2019.223-232.

Nafisfaturr, “Big Data - Diabetes classification,†Kaggle . Accessed: Oct. 05, 2025. [Online]. Available: https://www.Kaggle .com/code/nafisfaturr/big-data-diabetes-classification/input

P. R. Putri and R. Alit, “Klasifikasi Penyakit Diabetes Melitus Menggunakan Metode Support Vector Machine (SVM),†Journal of Informatics and Computer Science, vol. 06, 2024.

F. Aninda Nurdila, U. A. Dahlan, and I. ; Yogyakarta, “Penggunaan Metode Classification And Regression Tree (CART) Dalam Mengklasifikasikan Faktor Yang Mempengaruhi Penyakit Diabetesâ€, doi: 10.26555/konvergensi.30878.

N. al Rasyid, I. Afrianty, E. Budianita, and S. Kurnia Gusti, “Diabetes Classification using Gain Ratio Feature Selection in Support Vector Machine Method,†Bulletin of Informatics and Data Science, vol. 4, no. 1, 2025, doi: 10.61944/bids.v4i1.114.

Asri Mulyani, Sarah Khoerunisa, and Dede Kurniadi, “Perbandingan Kinerja Algoritma KNN dan SVM Menggunakan SMOTE untuk Klasifikasi Penyakit Diabetes,†Jurnal Nasional Teknik Elektro dan Teknologi Informasi, vol. 14, no. 1, pp. 25–34, Feb. 2025, doi: 10.22146/jnteti.v14i1.15198.

A. Wantoro, A. Fitria Yuliana, D. Yana, A. Andini, I. Awaliyani, and W. Caesarendra, “Optimizing Type 2 Diabetes Classification with Feature Selection and Class Balancing in Machine Learning,†Jurnal Teknik Informatika (JUTIF), vol. 6, no. 4, pp. 2723–3863, 2025, doi: 10.52436/1.jutif.2025.6.4.5166.

F. Refindha, A. Harianto, Z. Alawi, and I. A. Sa’ida, “PENGARUH KOMPOSISI SPLIT DATA PADA AKURASI KLASIFIKASI PENDERITA DIABETES MENGGUNAKAN ALGORITMA MACHINE LEARNING,†Jurnal Sistem Informasi dan Informatika (Simika), vol. 8, no. 1, 2025.

A. D. Cahyani and A. Basuki, “Klasifikasi Diabetes Mellitus Menggunakan Support Vector Machine (Studi Kasus: Puskesmas Modopuro, Mojokerto),†Rekayasa, vol. 12, no. 2, pp. 174–182, Oct. 2019, doi: 10.21107/rekayasa.v12i2.19763.

C. Z. V. Junus, T. Tarno, and P. Kartikasari, “KLASIFIKASI MENGGUNAKAN METODE SUPPORT VECTOR MACHINE DAN RANDOM FOREST UNTUK DETEKSI AWAL RISIKO DIABETES MELITUS,†Jurnal Gaussian, vol. 11, no. 3, pp. 386–396, Jan. 2023, doi: 10.14710/j.gauss.11.3.386-396.

M. Muhammad, J. Samodro, M. Kunta Biddinika, A. Fadlil, A. Dahlan, and Y. J. Ringroad Selatan, “Klasifikasi Penyakit Diabetes dengan Algoritma Decision Tree dan Naïve Bayes,†vol. 6, no. 2.

E. Ramadanti, D. A. Dinathi, C. Sri, K. Aditya, and R. Chandranegara, “Diabetes Disease Detection Classification Using Light Gradient Boosting (LightGBM) With Hyperparameter Tuning ,†Jurnal dan Penelitian Teknik Informatika, vol. 8, no. 2, 2024, doi: 10.33395/v8i2.13530.

S. Rahmawati, A. Wibowo, and A. F. N. Masruriyah, “Improving Diabetes Prediction Accuracy in Indonesia: A Comparative Analysis of SVM, Logistic Regression, and Naive Bayes with SMOTE and ADASYN,†Jurnal RESTI, vol. 8, no. 5, pp. 607–614, Oct. 2024, doi: 10.29207/resti.v8i5.5980.

N. Nurdiana and A. Algifari, “STUDI KOMPARASI ALGORITMA ID3 DAN ALGORITMA NAIVE BAYES UNTUK KLASIFIKASI PENYAKIT DIABETES MELLITUSâ€.

Downloads

Published

2026-03-24

How to Cite

[1]
N. Ariansyah and D. Hermanto, “Klasifikasi Risiko Diabetes Menggunakan Support Vector Machine Berbasis Feature Selection dan Hyperparameter Tuning”, RJTI, vol. 5, no. 1, pp. 60–67, Mar. 2026.

Issue

Section

Articles

Similar Articles

1 2 3 > >> 

You may also start an advanced similarity search for this article.