Trabajo de grado - Maestría
Visualización de clustering espacio-temporal, un entorno interactivo para el aprendizaje no supervisado de datos
Fecha
2019Registro en:
instname:Universidad de los Andes
reponame:Repositorio Institucional Séneca
Autor
Buitrago Ramírez, Jessika Johana
Institución
Resumen
El clustering es uno de los sub-campos principales y relativamente nuevos de la minería de datos espacio-temporales (E-T), es un proceso en el que se agrupan objetos basándose en la similitud de características espaciales y temporales. Como herramienta de minería de datos, el clustering espacio-temporal puede ser usado para ganar insight sobre la distribución de los datos, observar las características de cada cluster y encontrar en cada uno de ellos un foco adecuado de análisis, particularmente en un ambiente interactivo de visualización que brinde libertad al usuario experto del contexto de datos en su proceso de descubrimiento de conocimiento. Dada la robustez y calidad de los resultados, se tomarán en consideración para implementación los métodos basados en densidades (los cuales emplean algoritmos como ST-DBSCAN, ST-OPTICS y STSNN). En este documento se introducirán los conceptos relacionados con clustering de densidades para datos E-T y se realizara una comparación de los algoritmos más importantes que existen actualmente. Adicionalmente, se brindara una evaluación de resultados de la herramienta interactiva web Clu-Tool para realizar clustering de datos E-T reales como casos de estudio. Por último se describira una futura investigación en el campo de clustering para datos E-T. Clustering is one of the main and relatively new sub-elds of data mining in Spatio Temporal (S-T) data, it is a process in which the objects are grouped based on the similarity of spacial and temporal features. As a data mining tool, Spatio Temporal clustering can be used to gain insight about data distribution, to observe the features of each cluster and to nd in each of them an adequate analysis focus, particularly in an interactive environment of visualization that give to the data context expert user freedom in her knowledge discovery process. Because of the robustness and quality of the results, it will be take in consideration of implementation the density based methods (which apply algorithms such as ST-DBSCAN, ST-OPTICS and STSNN). In this document it will be introduced the concepts related to S-T density clustering and it will be compared the most important algorithms existing nowadays. Also, it will be given an evaluation of the results of the interactive web tool Clu-Tool to cluster real ST data as study cases. Finally, it will be described a future work in the S-T clustering field.