Penerapan Algoritma K-Means Untuk Pengelompokan Risiko Penyakit Diabetes: Pendekatan Berbasis Data untuk Deteksi Dini

Nabila Yuniarti; Najah Nur Aliyah; Widiana Salsabilah; Ziyad Dante Al Najji; Bibit Sudarsono; Wisti Dwi Septiani

doi:10.30606/rjti.v4i3.3518

Authors

Nabila Yuniarti Universitas Bina Sarana Informatika
Najah Nur Aliyah Universitas Bina Sarana Informatika
Widiana Salsabilah Universitas Bina Sarana Informatika
Ziyad Dante Al Najji Universitas Bina Sarana Informatika
Bibit Sudarsono Universitas Bina Sarana Informatika
Wisti Dwi Septiani Universitas Bina Sarana Informatika

DOI:

https://doi.org/10.30606/rjti.v4i3.3518

Keywords:

Diabetes, Insulin, K-Means, Cluster, RapidMiner

Abstract

Diabetes merupakan kondisi ketika pankreas tidak mampu memproduksi insulin secara optimal, atau ketika tubuh tidak dapat menggunakan insulin dengan efektif, sehingga distribusi insulin menjadi terganggu. Dalam pelaksanaan penelitian ini, peneliti mengadopsi dua pendekatan utama yang menjadi landasan dalam proses pengumpulan dan analisis data, yaitu studi literatur yang dilakukan dengan mencari, mengevaluasi, dan mengkaji berbagai artikel jurnal ilmiah, sumber terpercaya lainnya yang berkaitan dengan topik penelitian, dan penerapan algoritma K-Means yang memberikan gambaran lebih terstruktur mengenai distribusi kelompok pasien. Dalam proses analisis, digunakan aplikasi RapidMiner untuk mempermudah pengelompokan data dan memungkinkan peneliti mengevaluasi kinerja algoritma K-Means yang diterapkan. Dataset yang digunakan berisi 5.000 data pasien dan 9 atribut kesehatan, yang dikelompokkan menggunakan metode Elbow dan validasi dengan Davies-Bouldin Index, dengan nilai 0,827. Secara keseluruhan, terdapat tiga cluster Â utama yang masing-masing menunjukkan karakteristik kesehatan berbeda. Cluster Â pertama terdiri dari pasien dengan risiko rendah (45%), yang memiliki kadar gula darah normal dan tidak ada yang terdiagnosis diabetes. Cluster Â kedua menunjukkan kelompok dengan risiko menengah (35%) yang mulai menunjukkan gejala pra-diabetes serta peningkatan kadar gula darah dan beberapa faktor risiko lain. Sedangkan cluster Â ketiga berisi pasien dengan risiko tinggi (20%) yang memiliki kadar gula darah sangat tinggi, di mana sebagian besar sudah berada dalam fase diabetes dan menghadapi kondisi yang lebih serius. Temuan ini menunjukkan bahwa hasil klasterisasi tidak hanya menggambarkan variasi kondisi kesehatan pasien, tetapi juga memiliki nilai praktis dalam konteks medis, seperti membantu tenaga kesehatan melakukan deteksi dini, memprioritaskan pasien berisiko tinggi, serta mendukung strategi intervensi yang lebih personal dan tepat sasaran.

Downloads

Download data is not yet available.

References

N. Sunanto and G. Falah, â€œPenerapan Algoritma C4.5 Untuk Membuat Model Prediksi Pasien Yang Mengidap Penyakit Diabetes,â€ Rabit J. Teknol. dan Sist. Inf. Univrab, vol. 7, no. 2, pp. 208â€“216, 2022, doi: 10.36341/rabit.v7i2.2435.

A. E. Satriatama et al., â€œAnalisis Klaster Data Pasien Diabetes untuk Identifikasi Pola dan Karakteristik Pasien,â€ J. Teknol. Dan Sist. Inf. Bisnis, vol. 5, no. 3, pp. 172â€“182, 2023, doi: 10.47233/jteksis.v5i3.828.

A. M. Argina, â€œPenerapan Metode Klasifikasi K-Nearest Neigbor pada Dataset Penderita Penyakit Diabetes,â€ Indones. J. Data Sci., vol. 1, no. 2, pp. 29â€“33, 2020, doi: 10.33096/ijodas.v1i2.11.

K. Ogurtsova et al., â€œIDF diabetes Atlas: Global estimates of undiagnosed diabetes in adults for 2021,â€ Diabetes Res. Clin. Pract., vol. 183, 2022, doi: 10.1016/j.diabres.2021.109118.

C. Wang et al., â€œUnsupervised cluster analysis of clinical and metabolite characteristics in patients with chronic complications of T2DM: an observational study of real data,â€ Front. Endocrinol. (Lausanne)., vol. 14, no. October, pp. 1â€“12, 2023, doi: 10.3389/fendo.2023.1230921.

W. Aulia, A. Putera Utama Siahaan, L. Marlina, and M. Iqbal, â€œAnalisis Algoritma K-Means Cluster ing Dalam Identifikasi Tingkat Risiko Penyakit Berdasarkan Data Rekam Medis Pasien,â€ J. Sci. Soc. Res., vol. 4307, no. 3, pp. 3457â€“3465, 2025, [Online]. Available: http://jurnal.goretanpena.com/index.php/JSSR

Wijoyo A, Saputra A, Ristanti S, Syaâ€™ban S, Amalia M, and Febriansyah R, â€œPembelajaran Machine Learning,â€ OKTAL (Jurnal Ilmu Komput. dan Sci., vol. 3, no. 2, pp. 375â€“380, 2024, [Online]. Available: https://journal.mediapublikasi.id/index.php/oktal/article/view/2305

M. Pandia, â€œKajian Literatur Multimedia Retrieval : Machine Learning Untuk Pengenalan Wajah,â€ J. Ilmu Komput. dan Sist. Inf., vol. 7, no. 1, pp. 161â€“166, 2024, doi: 10.55338/jikomsi.v7i1.2758.

E. Retnoningsih and R. Pramudita, â€œMengenal Machine Learning Dengan Teknik Supervised Dan Unsupervised Learning Menggunakan Python,â€ Bina Insa. Ict J., vol. 7, no. 2, p. 156, 2020, doi: 10.51211/biict.v7i2.1422.

B. G. Sudarsono, M. I. Leo, A. Santoso, and F. Hendrawan, â€œAnalisis Data Mining Data Netflix Menggunakan Aplikasi Rapid Miner,â€ JBASE - J. Bus. Audit Inf. Syst., vol. 4, no. 1, pp. 13â€“21, 2021, doi: 10.30813/jbase.v4i1.2729.

Syahril Dwi Prasetyo, Shofa Shofiah Hilabi, and Fitri Nurapriani, â€œAnalisis Sentimen Relokasi Ibukota Nusantara Menggunakan Algoritma NaÃ¯ve Bayes dan KNN,â€ J. KomtekInfo, vol. 10, pp. 1â€“7, 2023, doi: 10.35134/komtekinfo.v10i1.330.

M. Qusyairi, Z. Hidayatullah, A. Sandi, and V. No, â€œInfotek : Jurnal Informatika dan Teknologi Penerapan K-Means Cluster ing Dalam Pengelompokan Prestasi Siswa Dengan Optimasi Metode Elbow Infotek : Jurnal Informatika dan Teknologi Perkembangan teknologi saat ini berkembang dengan sangat pesat ini terbukti,â€ vol. 7, no. 2, pp. 500â€“510, 2024.

A. I. Silitonga, Z. A. Nabila, C. R. Z. Lubis, N. Safitri, and H. Haryadi, â€œKlasterisasi Gizi Buruk Dan Stunting Di Provinsi Sumatera Utara Menggunakan K-Means Cluster ing,â€ Method. J. Tek. Inform. dan Sist. Inf., vol. 10, no. 2, pp. 13â€“18, 2024, doi: 10.46880/mtk.v10i2.3147.

Y. R. Sari, A. Sudewa, D. A. Lestari, and T. I. Jaya, â€œPenerapan Algoritma K-Means Untuk Cluster ing Data Kemiskinan Provinsi Banten Menggunakan RapidMiner ,â€ CESS (Journal Comput. Eng. Syst. Sci., vol. 5, no. 2, p. 192, 2020, doi: 10.24114/cess.v5i2.18519.

L. Hanum, â€œPengelompokan Gaya Belajar Mahasiswa Menggunakan Metode K-Means dan Validasi Menggunakan Davies Bouldin Index,â€ J. J-MendiKKom (Jurnal Manajemen, Pendidik. dan Ilmu Komputer), vol. 2, no. 1, 2025.

Lukman, Rachmasari Pramita Wardhani, Selvia Sarungu, and Irma Andrianti, â€œPenggunaan Metode Seven Tool Dengan Diagram Scatter Dalam Pembelajaran Pengendalian Mutu Secara Statistik,â€ J. Teknosains Kodepena, vol. 5, no. 1, pp. 27â€“33, 2024, doi: 10.54423/teknosains.v5i1.81.