info:eu-repo/semantics/bachelorThesis
Diseño de un modelo computacional de minería de datos multidimensional utilizando lattices conceptuales para la búsqueda de conocimiento en entornos OLAP
Fecha
2014Autor
Mendívez Vásquez, Bruno Luis
Institución
Resumen
En esta tesis se presenta un modelo de minería de datos multidimensional (basado en la arquitectura de minería analítica en línea OLAM), el cual consiste en una solución de capa tres que cuenta con motores de análisis multidimensional y minería de datos ejecutándose en conjunto, con el fin de extraer reglas de asociación exactas o aproximadas a partir de la formalización de una consulta multidimensional basada en restricciones. Este modelo fue concebido como una manera de extraer conocimiento dirigido por el descubrimiento (reglas de asociación) a partir de un cubo de datos o datamart, el cual principalmente, tiene una estructura multidimensional con capacidad de extracción de conocimiento dirigido por hipótesis.
Por tanto, este modelo de capa tres OLAM tiene la capacidad de ejecutar algoritmos
de minería de datos dentro de un espacio de búsqueda reducido, resultado de una consulta basada en restricciones aplicada a un datamart.
Este modelo de capa tres, a través de la formalización de una consulta basada en restricciones, reduce de manera significativa el espacio de búsqueda de un cubo de datos, identificando de la consulta, las dimensiones involucradas así como sus columnas y filtros, resultando en una tabla de datos o contexto multivaluado. Este contexto es después transformado a un contexto formal binario con el uso de escalas personalizadas para cada uno de los atributos multivaluados. A partir del contexto binario resultante, un iceberg concept lattice es derivado con la finalidad de identificar un conjunto de itemsets frecuentes, los cuales son el punto de partida para el proceso de minería de reglas de asociación. Finalmente, y de acuerdo a la especificación de un soporte y confianza mínimos, las bases de Duquenne-Guigues y de Luxenburger son presentadas como resultado de la consulta inicial para su posterior análisis