doctoralThesis
Um modelo multidimensional em padrões de grafo para realizar consultas analíticas e topológicas de grafos agregados
Registro en:
SOUSA, Paulo Orlando Vieira de Queiroz. Um Modelo Multidimensional em Padrões de Grafo para Realizar Consultas Analíticas e Topológicas de Grafos Agregados. 2019. Tese (Doutorado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2019.
Autor
SOUSA, Paulo Orlando Vieira de Queiroz
Institución
Resumen
Muitos sistemas reais produzem dados em rede ou dados altamente interconectados, os quais podem ser representados em grafo. Os dados das redes de informação formam um componente crítico na infraestrutura da informação moderna, constituindo um grande volume de dados em grafo. A análise das redes de informações abrange diversas áreas, entre elas são destaques as tecnologias OLAP e as análises associadas à estrutura (ou topologia) do grafo. OLAP é uma tecnologia que permite a análise multidimensional e em vários níveis de granularidade, fornecendo visualizações de dados agregados com diferentes perspectivas. A combinação dos algoritmos de análise topológica do grafo com as tecnologias OLAP está em evidência, corroborando com os estudos recentes na área de Grafo BI, ou Business Intelligence em grafo. Considerando esse cenário, definimos um modelo multidimensional em grafo para ser usado junto a um SGBDG (Sistema Gerenciador de Bancos de Dados em Grafo). Esse modelo permite analisar padrões em grafo por meio de consultas multidimensionais, combinando os algoritmos de análise em grafo e os operadores OLAP para fornecer uma visualização multidimensional de grafos agregados. Em comparação com as abordagens da literatura, nossa proposta é a primeira a combinar esses recursos de análise nas consultas de um SGBDG. No desenvolvimento deste trabalho, implementamos um plugin para o SGBDG Neo4j que permite a produção de consultas multidimensionais analíticas e topológicas em padrões de grafo. Os resultados dessas consultas são representados visualmente, mostrando tanto valores agregados das medidas topológicas e analíticas, quanto a estrutura do grafo agregado. Na experimentação, utilizamos os dados do DBLP para compor diferentes modelagens, a fim de retratar diferentes variações de consulta com grafo agregado. CAPES Many real systems produce networked or highly interconnected data, which can be represented in a graph structure. Information network data is a critical component of modern information infrastructure, constituting a large volume of graph data. The analysis of information networks covers several areas, amongst them are the OLAP technologies and the analysis associated with the structure (or topology) of the graph. OLAP is a technology that enables multi-dimensional and multi-level analysis of granularity, providing aggregate data views with different perspectives. The combination of graph topological analysis algorithms with OLAP technologies is in evidence, corroborating recent studies in the area of Graph BI, or business intelligence in graph. Considering this scenario, we have defined a multidimensional graph model to be used in conjunction with a Graph Database Management System (GDBMS). This model allows one to analyze graph patterns through multidimensional queries, combining graph analysis algorithms and OLAP operators to provide a multidimensional view of aggregate graphs. Compared to literature approaches, our proposal is the first to combine these parsing capabilities into queries of a GDBMS. In the development of this work, we implemented a plugin for the GDBMS Neo4j that allows the production of analytical and topological multidimensional queries in graph patterns. The results of these queries are illustrated, showing both aggregate values of topological and analytical measurements, and the structure of the aggregate graph. In experimentation, we use DBLP data to compose different models in order to portray different query variations with aggregate graph.