Penerapan Algoritma K-Means Untuk Pengelompokan Risiko Penyakit Diabetes: Pendekatan Berbasis Data untuk Deteksi Dini

Authors

  • Nabila Yuniarti Universitas Bina Sarana Informatika
  • Najah Nur Aliyah Universitas Bina Sarana Informatika
  • Widiana Salsabilah Universitas Bina Sarana Informatika
  • Ziyad Dante Al Najji Universitas Bina Sarana Informatika
  • Bibit Sudarsono Universitas Bina Sarana Informatika
  • Wisti Dwi Septiani Universitas Bina Sarana Informatika

DOI:

https://doi.org/10.30606/rjti.v4i3.3518

Keywords:

Diabetes, Insulin, K-Means, Cluster, RapidMiner

Abstract

Diabetes merupakan kondisi ketika pankreas tidak mampu memproduksi insulin secara optimal, atau ketika tubuh tidak dapat menggunakan insulin dengan efektif, sehingga distribusi insulin menjadi terganggu. Dalam pelaksanaan penelitian ini, peneliti mengadopsi dua pendekatan utama yang menjadi landasan dalam proses pengumpulan dan analisis data, yaitu studi literatur yang dilakukan dengan mencari, mengevaluasi, dan mengkaji berbagai artikel jurnal ilmiah, sumber terpercaya lainnya yang berkaitan dengan topik penelitian, dan penerapan algoritma K-Means yang memberikan gambaran lebih terstruktur mengenai distribusi kelompok pasien. Dalam proses analisis, digunakan aplikasi RapidMiner untuk mempermudah pengelompokan data dan memungkinkan peneliti mengevaluasi kinerja algoritma K-Means yang diterapkan. Dataset yang digunakan berisi 5.000 data pasien dan 9 atribut kesehatan, yang dikelompokkan menggunakan metode Elbow dan validasi dengan Davies-Bouldin Index, dengan nilai 0,827. Secara keseluruhan, terdapat tiga cluster  utama yang masing-masing menunjukkan karakteristik kesehatan berbeda. Cluster  pertama terdiri dari pasien dengan risiko rendah (45%), yang memiliki kadar gula darah normal dan tidak ada yang terdiagnosis diabetes. Cluster  kedua menunjukkan kelompok dengan risiko menengah (35%) yang mulai menunjukkan gejala pra-diabetes serta peningkatan kadar gula darah dan beberapa faktor risiko lain. Sedangkan cluster  ketiga berisi pasien dengan risiko tinggi (20%) yang memiliki kadar gula darah sangat tinggi, di mana sebagian besar sudah berada dalam fase diabetes dan menghadapi kondisi yang lebih serius. Temuan ini menunjukkan bahwa hasil klasterisasi tidak hanya menggambarkan variasi kondisi kesehatan pasien, tetapi juga memiliki nilai praktis dalam konteks medis, seperti membantu tenaga kesehatan melakukan deteksi dini, memprioritaskan pasien berisiko tinggi, serta mendukung strategi intervensi yang lebih personal dan tepat sasaran.

Downloads

Download data is not yet available.

References

N. Sunanto and G. Falah, “Penerapan Algoritma C4.5 Untuk Membuat Model Prediksi Pasien Yang Mengidap Penyakit Diabetes,†Rabit J. Teknol. dan Sist. Inf. Univrab, vol. 7, no. 2, pp. 208–216, 2022, doi: 10.36341/rabit.v7i2.2435.

A. E. Satriatama et al., “Analisis Klaster Data Pasien Diabetes untuk Identifikasi Pola dan Karakteristik Pasien,†J. Teknol. Dan Sist. Inf. Bisnis, vol. 5, no. 3, pp. 172–182, 2023, doi: 10.47233/jteksis.v5i3.828.

A. M. Argina, “Penerapan Metode Klasifikasi K-Nearest Neigbor pada Dataset Penderita Penyakit Diabetes,†Indones. J. Data Sci., vol. 1, no. 2, pp. 29–33, 2020, doi: 10.33096/ijodas.v1i2.11.

K. Ogurtsova et al., “IDF diabetes Atlas: Global estimates of undiagnosed diabetes in adults for 2021,†Diabetes Res. Clin. Pract., vol. 183, 2022, doi: 10.1016/j.diabres.2021.109118.

C. Wang et al., “Unsupervised cluster analysis of clinical and metabolite characteristics in patients with chronic complications of T2DM: an observational study of real data,†Front. Endocrinol. (Lausanne)., vol. 14, no. October, pp. 1–12, 2023, doi: 10.3389/fendo.2023.1230921.

W. Aulia, A. Putera Utama Siahaan, L. Marlina, and M. Iqbal, “Analisis Algoritma K-Means Cluster ing Dalam Identifikasi Tingkat Risiko Penyakit Berdasarkan Data Rekam Medis Pasien,†J. Sci. Soc. Res., vol. 4307, no. 3, pp. 3457–3465, 2025, [Online]. Available: http://jurnal.goretanpena.com/index.php/JSSR

Wijoyo A, Saputra A, Ristanti S, Sya’ban S, Amalia M, and Febriansyah R, “Pembelajaran Machine Learning,†OKTAL (Jurnal Ilmu Komput. dan Sci., vol. 3, no. 2, pp. 375–380, 2024, [Online]. Available: https://journal.mediapublikasi.id/index.php/oktal/article/view/2305

M. Pandia, “Kajian Literatur Multimedia Retrieval : Machine Learning Untuk Pengenalan Wajah,†J. Ilmu Komput. dan Sist. Inf., vol. 7, no. 1, pp. 161–166, 2024, doi: 10.55338/jikomsi.v7i1.2758.

E. Retnoningsih and R. Pramudita, “Mengenal Machine Learning Dengan Teknik Supervised Dan Unsupervised Learning Menggunakan Python,†Bina Insa. Ict J., vol. 7, no. 2, p. 156, 2020, doi: 10.51211/biict.v7i2.1422.

B. G. Sudarsono, M. I. Leo, A. Santoso, and F. Hendrawan, “Analisis Data Mining Data Netflix Menggunakan Aplikasi Rapid Miner,†JBASE - J. Bus. Audit Inf. Syst., vol. 4, no. 1, pp. 13–21, 2021, doi: 10.30813/jbase.v4i1.2729.

Syahril Dwi Prasetyo, Shofa Shofiah Hilabi, and Fitri Nurapriani, “Analisis Sentimen Relokasi Ibukota Nusantara Menggunakan Algoritma Naïve Bayes dan KNN,†J. KomtekInfo, vol. 10, pp. 1–7, 2023, doi: 10.35134/komtekinfo.v10i1.330.

M. Qusyairi, Z. Hidayatullah, A. Sandi, and V. No, “Infotek : Jurnal Informatika dan Teknologi Penerapan K-Means Cluster ing Dalam Pengelompokan Prestasi Siswa Dengan Optimasi Metode Elbow Infotek : Jurnal Informatika dan Teknologi Perkembangan teknologi saat ini berkembang dengan sangat pesat ini terbukti,†vol. 7, no. 2, pp. 500–510, 2024.

A. I. Silitonga, Z. A. Nabila, C. R. Z. Lubis, N. Safitri, and H. Haryadi, “Klasterisasi Gizi Buruk Dan Stunting Di Provinsi Sumatera Utara Menggunakan K-Means Cluster ing,†Method. J. Tek. Inform. dan Sist. Inf., vol. 10, no. 2, pp. 13–18, 2024, doi: 10.46880/mtk.v10i2.3147.

Y. R. Sari, A. Sudewa, D. A. Lestari, and T. I. Jaya, “Penerapan Algoritma K-Means Untuk Cluster ing Data Kemiskinan Provinsi Banten Menggunakan RapidMiner ,†CESS (Journal Comput. Eng. Syst. Sci., vol. 5, no. 2, p. 192, 2020, doi: 10.24114/cess.v5i2.18519.

L. Hanum, “Pengelompokan Gaya Belajar Mahasiswa Menggunakan Metode K-Means dan Validasi Menggunakan Davies Bouldin Index,†J. J-MendiKKom (Jurnal Manajemen, Pendidik. dan Ilmu Komputer), vol. 2, no. 1, 2025.

Lukman, Rachmasari Pramita Wardhani, Selvia Sarungu, and Irma Andrianti, “Penggunaan Metode Seven Tool Dengan Diagram Scatter Dalam Pembelajaran Pengendalian Mutu Secara Statistik,†J. Teknosains Kodepena, vol. 5, no. 1, pp. 27–33, 2024, doi: 10.54423/teknosains.v5i1.81.

Downloads

Published

2025-11-30

How to Cite

[1]
N. Yuniarti, N. Nur Aliyah, Widiana Salsabilah, Z. Dante Al Najji, B. Sudarsono, and W. Dwi Septiani, “Penerapan Algoritma K-Means Untuk Pengelompokan Risiko Penyakit Diabetes: Pendekatan Berbasis Data untuk Deteksi Dini”, RJTI, vol. 4, no. 3, p. 386 – 395 , Nov. 2025.

Similar Articles

You may also start an advanced similarity search for this article.