info:eu-repo/semantics/bachelorThesis
Ensayo en modelos predictivos de Data Mining para diabetes en etapa temprana
Fecha
2023Autor
Leiva Quispe, José Enrique
Institución
Resumen
La diabetes se ha vuelto un problema de salud crónica tan común, pero a la vez
mortal, que se ha incrementado considerablemente en los últimos años. Alrededor del 50% de todas las personas que padecen diabetes no están diagnosticadas debido a su fase asintomática a largo plazo, es por ello que detectar la diabetes en una etapa prematura es de vital importancia. La ciencia ha avanzado tanto en el campo de la salud que las técnicas de clasificación de minería de datos han sido bien aceptadas por la comunidad científica para el modelo predictivo de riesgo de la enfermedad. En la presente investigación, se ha utilizado un conjunto de 520 datos, el cual se recopiló información mediante una encuesta directa a los pacientes del Sylhet Diabetes Hospital en Bangladesh. Se procedió a realizar el respectivo análisis utilizando algoritmos de clasificación como Regresión Logística (técnica estadística clásica) y Máquina de Soporte Vectorial (técnica de aprendizaje automático).
Luego de ajustar los modelos y evaluar mediante métricas como accuracy, sensibilidad y
AUC (en ese orden), se ha encontrado que el modelo de Máquina de Soporte Vectorial tiene un mejor ajuste y poder predictivo (0.98, 0.98, 0.99) frente al modelo de regresión logística (0.92, 0.94, 0.97). Posteriormente, como sugerencia se planteó consejos útiles para controlar los factores de riesgo