Tesis de maestría
Modelo de decisión para la validación de métodos de imputación mediante la utilización de algoritmos de minería de datos
Fecha
2022Registro en:
Primorac, Carlos Roberto, 2022. Modelo de decisión para la validación de métodos de imputación mediante la utilización de algoritmos de minería de datos. Tesis de maestría. Corrientes: Universidad Nacional del Nordeste. Facultad de Ciencias Exactas y Naturales y Agrimensura.
Autor
Primorac, Carlos Roberto
Institución
Resumen
Muchos de los conjuntos de datos existentes u obtenidos en investigaciones científicas contienen valores faltantes y otras anomalías originadas en diferentes causas. En minería de datos, estas imperfecciones pueden afectar negativamente la calidad del proceso de aprendizaje supervisado o el rendimiento de algoritmos de agrupamiento de datos. La imputación es una técnica para reemplazar valores faltantes con valores calculados utilizando los datos existentes. Se desarrolló una metodología de evaluación del desempeño de métodos de imputación mediante una métrica tradicional complementada con un nuevo indicador y un entorno para realizar los experimentos de amputación y posterior imputación. Además se trabajó en encontrar los métodos de imputación más adecuados para completar los valores faltantes en un conjunto de datos mediante la utilización de algoritmos de minería de datos. En todos los escenarios evaluados, los métodos más apropiados resultaron ser k-NN y K-Means.