Objeto de conferencia
Modelo de decisión para la validación de métodos de imputación mediante la utilización de algoritmos de minería de datos
Registro en:
isbn:978-987-3619-27-4
Autor
Primorac, Carlos R.
Acosta, Julio César
La Red Martínez, David L.
Institución
Resumen
Muchos de los conjuntos de datos (data sets) existentes u obtenidos en investigaciones científicas contienen valores faltantes (MVs: Missing Values) y anomalías (outliers) asociados a procedimientos de entrada manuales deficientes, mediciones incorrectas o errores en los instrumentos de medición. En minería de datos (DM: Data Mining) estas imperfecciones pueden afectar negativamente la calidad del proceso de aprendizaje supervisado o el rendimiento de algoritmos de agrupamiento de datos. La imputación es una técnica para reemplazar MVs con valores sustituidos. Pocos estudios informan una evaluación global de los métodos existentes con el fin de proporcionar directrices para hacer la elección metodológica más apropiada en la práctica. El propósito general de este trabajo es determinar un modelo de decisión que permita encontrar los métodos de imputación más adecuados para completar información faltante en un conjunto de datos mediante la utilización de algoritmos de DM. Eje: Bases de Datos y Minería de Datos. Red de Universidades con Carreras en Informática