Tesis
Análisis visual de la evolución de temas en Corpus de documentos usando árboles de Similitud
Fecha
2018Autor
Rodríguez Urquiaga, Roberto Josué
Institución
Resumen
En este trabajo se propone visualizar la evolución temática de corpus de documentos usando Neighbor joining tree (NJT). Para poder lograr esto es necesario extraer vectores característicos que conserven una fecha probabilista aproximada, además conservar su informacián temática. Para este fin se utilizó trabajos previos como CITATION-Latent Dirichlet Allocation (CITATION-LDA) que posee la ventaja de conservar la información antes mencionada, haciendo uso de las citas bibliográficas como vector característico para la extracción del tema. Mediante probabilidad es posible obtener una fecha aproximada del tópico analizado, esto gracias a que cada elemento del vector característico es un documento que posee una fecha de publicación. Esto se uso para construir el mapa visual a través del algoritmo Neighbor joining tree antes usado para la construcción de árboles filogenéticos y Radial layout un me´todo para presentar los resultados de una forma visualmente organizada en el cual se pueda apreciar las relaciones de similitud. También se agregó a la visualización interactividad para facilitar el trabajo de análisis de usuario. Los resultados muestran la evolución de temas organizados por similitud de contenido y temporal además de la interacción temática, comparación de similaridades entre tópicos e información entre de metadatos es superior a métodos anteriormente propuestos.