Tesis
Modelo de sistema de apoyo a decisiones para la priorización de proyectos de inversión pública aplicando minería de datos
Fecha
2020Autor
Chirinos Zegarra, Ybeth Yesselen
Institución
Resumen
El presente trabajo de investigación propone un modelo de sistema de apoyo a decisiones para priorizar los proyectos de inversión pública aplicando Minería de Datos, debido a la necesidad de optimizar el gasto público de las Entidades del Estado y disminuir brechas sociales. La priorización de proyectos de inversión pública como apoyo a decisiones aplicando minería de datos ayudará a seleccionar los proyectos que tengan un gran impacto y contribuyan en la disminución de las distintas brechas que se han identificado dentro del sistema Invierte.pe. El modelo propuesto considera el esquema KDD Knowledge Discovery in Databases (Descubrimiento de Conocimiento en Base de Datos), que consta de cinco procesos, siendo en el proceso denominado “Transformación” la incorporación de Criterios de Priorización, según las guías establecidas por el Ministerio de Económica y Finanzas. Los métodos de clasificación como árboles de decisión, reglas de decisión, Bayes y otros se pueden aplicar a los datos para generar conocimiento que ayude a las autoridades a tomar decisiones respecto a los proyectos a ejecutarse. Para el presente modelo se aplicaron diez algoritmos de clasificación, donde según el resultado de correcta clasificación de instancias se evaluaron los 3 algoritmos con mayor porcentaje. Los resultados obtenidos demostraron que la técnica de minería de datos de Trees.J48 alcanzó el mejor porcentaje de clasificación con un 98.1013% frente a otros algoritmos populares de clasificación; por lo que se concluye que el algoritmo Trees.J48 de árbol de decisión de minería de datos puede apoyar de un modo aceptable en la aplicación del modelo de sistema de apoyo a decisiones para la priorización de proyectos de inversión pública aplicando minería de datos. El análisis de los resultados del algoritmo Trees.J48 se compara con los algoritmos Rules.JRip y RandomForest.y se encontró que Rules.JRip es tan eficiente como el Trees.J48 en términos de precisión de los resultados, esto debido a su porcentaje de Precisión General y Coeficiente Kappa.