Model Klasifikasi Usia Kematian Neonatal (â‰¤1 Hari dan >1 Hari) Berbasis Machine Learning

Evina Widianawati; Nugraheni Kusumawati; Hugi Cerlyawati; Yanita Sri  Mulyani

doi:10.30606/rjti.v5i1.4302

Authors

Evina Widianawati Universitas Dian Nuswantoro
Nugraheni Kusumawati Universitas Dian Nuswantoro
Hugi Cerlyawati Universitas Dian Nuswantoro
Yanita Sri Mulyani Universitas Dian Nuswantoro

DOI:

https://doi.org/10.30606/rjti.v5i1.4302

Keywords:

Prediksi, Neonatal, Usia, Model, Machine Learning

Abstract

Periode neonatal, khususnya dalam 24 jam pertama kehidupan, merupakan fase kritis dengan risiko morbiditas dan mortalitas tinggi. Identifikasi pola klinis yang membedakan neonatus usia â‰¤1 hari dan >1 hari penting untuk mendukung pengambilan keputusan klinis berbasis data. Tujuan penelitian ini yaitu membandingkan performa beberapa algoritma machine learning dalam mengklasifikasikan usia neonatus serta mengidentifikasi faktor klinis yang paling berkontribusi. Penelitian analitik observasional ini menggunakan data sekunder rekam medis neonatus sebanyak 41 kasus di rumah sakit X di kota Semarang. Variabel prediktor meliputi jenis kelamin, usia gestasi, berat badan, tinggi badan, jumlah diagnosa sekunder, diagnosa utama, dan cara melahirkan. Lima algoritma diuji: Logistic Regression, Support Vector Machine (RBF), Random Forest, HistGradientBoosting, dan XGBoost. Evaluasi dilakukan menggunakan Stratified K-Fold Cross Validation dengan metrik akurasi, presisi makro, recall makro, dan F1 score. Analisis faktor terpenting dilakukan menggunakan Random Forest. Random Forest menunjukkan performa terbaik dengan akurasi 0,686 dan F1 tertimbang 0,610 Â± 0,182. HistGradientBoosting dan SVM mencapai akurasi 0,657, sedangkan Regresi Logistik dan XGBoost masing-masing 0,595 dan 0,557. Usia gestasi merupakan faktor paling berpengaruh, diikuti tinggi badan, jumlah diagnosa sekunder, dan berat badan. Beberapa diagnosa utama terkait gangguan pernapasan juga termasuk dalam faktor penting. Random Forest memberikan kombinasi akurasi dan stabilitas terbaik dalam memprediksi usia kematian bayi baru lahir.

Downloads

Download data is not yet available.

References

L. Hug, M. Alexander, D. You, and L. Alkema, â€œNational, regional, and global levels and trends in neonatal mortality between 1990 and 2017, with scenario-based projections to 2030: A systematic analysis,â€ Lancet Glob. Health, vol. 7, no. 6, pp. e710â€“e720, 2019.

M. J. Sankar, C. K. Natarajan, R. R. Das, R. Agarwal, A. Chandrasekaran, and V. K. Paul, â€œWhen do newborns die? A systematic review of timing of overall and cause-specific neonatal deaths in developing countries,â€ Lancet Glob. Health, vol. 4, no. 10, pp. e700â€“e711, 2016.

World Health Organization, â€œNewborn mortality fact sheet,â€ Geneva, Switzerland: WHO, 2023.

R. L. Goldenberg, J. F. Culhane, J. D. Iams, and R. Romero, â€œEpidemiology and causes of preterm birth,â€ Lancet, vol. 371, no. 9606, pp. 75â€“84, 2008.

H. Blencowe et al., â€œNational, regional, and worldwide estimates of preterm birth rates in the year 2010,â€ Lancet, vol. 379, no. 9832, pp. 2162â€“2172, 2012.

B. J. Stoll et al., â€œTrends in care practices, morbidity, and mortality of extremely preterm neonates, 1993â€“2012,â€ JAMA, vol. 314, no. 10, pp. 1039â€“1051, 2015.

A. Rajkomar, J. Dean, and I. Kohane, â€œMachine learning in medicine,â€ N. Engl. J. Med., vol. 380, no. 14, pp. 1347â€“1358, 2019.

A. L. Beam and I. S. Kohane, â€œBig data and machine learning in health care,â€ JAMA, vol. 319, no. 13, pp. 1317â€“1318, 2018.

C. Cortes and V. Vapnik, â€œSupport-vector networks,â€ Mach. Learn., vol. 20, no. 3, pp. 273â€“297, 1995.

A. Esteva et al., â€œA guide to deep learning in healthcare,â€ Nat. Med., vol. 25, no. 1, pp. 24â€“29, 2019.

E. J. Topol, â€œHigh-performance medicine: The convergence of human and artificial intelligence,â€ Nat. Med., vol. 25, no. 1, pp. 44â€“56, 2019.

L. Breiman, â€œRandom Forests,â€ Mach. Learn., vol. 45, no. 1, pp. 5â€“32, 2001.

J. H. Friedman, â€œGreedy function approximation: A gradient boosting machine,â€ Ann. Stat., vol. 29, no. 5, pp. 1189â€“1232, 2001.

G. Varoquaux, â€œCross-validation failure: Small sample sizes lead to large error bars,â€ NeuroImage, vol. 180, pp. 68â€“77, 2018.

E. W. Steyerberg, Clinical Prediction Models: A Practical Approach to Development, Validation, and Updating, 2nd ed. Cham, Switzerland: Springer, 2019.

T. Chen and C. Guestrin, â€œXGBoost: A scalable tree boosting system,â€ in Proc. 22nd ACM SIGKDD Int. Conf. Knowl. Discov. Data Min., 2016, pp. 785â€“794.

G. Biau and E. Scornet, â€œA Random Forest guided tour,â€ Test, vol. 25, no. 2, pp. 197â€“227, 2016.

J. Lever, M. Krzywinski, and N. Altman, â€œPoints of significance: Cross-validation,â€ Nat. Methods, vol. 13, no. 8, pp. 703â€“704, 2016.

G. S. Collins, J. B. Reitsma, D. G. Altman, and K. G. M. Moons, â€œTransparent reporting of a multivariable prediction model for individual prognosis or diagnosis (TRIPOD): The TRIPOD statement,â€ BMJ, vol. 350, p. g7594, 2015.

S. M. Lundberg and S.-I. Lee, â€œA unified approach to interpreting model predictions,â€ in Adv. Neural Inf. Process. Syst. (NeurIPS), vol. 30, 2017, pp. 4765â€“4774.

T. G. Dietterich, â€œEnsemble methods in machine learning,â€ in Multiple Classifier Systems, Lecture Notes in Computer Science, vol. 1857, 2000, pp. 1â€“15.

R. Caruana and A. Niculescu-Mizil, â€œAn empirical comparison of supervised learning algorithms,â€ in Proc. 23rd Int. Conf. Mach. Learn. (ICML), 2006, pp. 161â€“168.

W. S. Noble, â€œWhat is a support vector machine?â€ Nat. Biotechnol., vol. 24, no. 12, pp. 1565â€“1567, 2006.

C. Molnar, Interpretable Machine Learning, 2nd ed., 2022. [Online]. Available: https://christophm.github.io/interpretable-ml-book/

L. Wynants et al., â€œPrediction models for diagnosis and prognosis of COVID-19 infection: Systematic review and critical appraisal,â€ BMJ, vol. 369, p. m1328, 2020.