masterThesis
CSB-Index: um índice espacial para data warehouses geográficos na nuvem
Registro en:
Autor
Mateus, Rodrigo Costa
Institución
Resumen
Plataformas de computação em nuvem proveem escalabilidade, elasticidade e tolerância
a falhas aos sistemas computacionais. Além disso, elas foram projetadas para lidar com grande
volume de dados utilizando recursos computacionais quase ilimitados. Data Warehouse
Geográfico (DWG) se tornou uma das principais tecnologias de suporte à decisão, pois promove
a integração do Data Warehouse convencionais, das ferramentas On-Line Analytical Processing
e dos Sistemas de Informações Geográficas. Por esse motivo, um DWG viabiliza a análise no
contexto espacial aliada à execução de consultas multidimensionais envolvendo grande volume
de dados. A combinação da computação em nuvem e dos DWG traz consigo o desafio de prover
análises de dados espaciais em um ambiente distribuído. Além disso, há a preocupação com o
desempenho no processamento de consultas, que utilizam janelas de consultas espaciais ad-hoc e
realizam várias junções entre as tabelas de dimensões e de fatos. Embora existam eficientes
mecanismos para aumentar o desempenho do processamento de consultas em DWG, como as
estruturas de indexação, elas se tornam impróprias aos DWG mantidos em nuvem porque estes
mecanismos não lidam com a recuperação de dados em ambientes distribuídos. Nesta dissertação,
propõe-se um novo índice para DWG mantidos em nuvem chamado CSB-Index (Cloud Spatial-
Bitmap Index). O CSB-Index se baseia no SB-Index e permite a recuperação de dados mantidos
em um ambiente distribuído, pois mantém em sua estrutura referências aos bancos de dados que
compõe o DWG. Além disso, ele introduz o uso do Índice Bitmap de Junção aos DWG
armazenados em nuvem, evitando o processamento das custosas operações de junção estrela. A
viabilidade do CSB-Index foi comprovada por meio de testes experimentais de desempenho e
escalabilidade. Comparações entre diferentes métodos de acesso indicaram que o CSB-Index
diminuiu significativamente o tempo de resposta do processamento de consultas roll-up e drilldown
relacionadas aos predicados espaciais “intersecta”, “está contido” e “contém”,
possibilitando redução no tempo de processamento destas consultas de 58,2% até 99,65%.
Também foi verificado que a escalabilidade dos dados e do número de máquinas que armazenam
o DWG não afetam negativamente o desempenho do CSB-Index. Por fim, este trabalho também
investigou o impacto do uso das federações no processamento das consultas SOLAP e comprovou
que está técnica possibilita maior desempenho ao processamento destas consultas.