TCCgrad
UM ESTUDO DE ARQUITETURA E GERENCIAMENTO DE METADADOS PARA DATA LAKES
Fecha
21-03-22Autor
Rodrigues, Jessica Xafranski
Ferreira, Allan
Institución
Resumen
O crescente aumento na quantidade de dados atualmente disponíveis na Internet ou gerados por pessoas e organizações gera uma necessidade de gerenciar de maneira mais eficiente essa massa com tantas variações de informação. Esses dados heterogêneos de diferentes fontes distintas são chamados de metadados, são dados sobre outros dados e vem crescendo paralelamente à tecnologia. Esse aumento também cria a necessidade de gerenciar toda essa cadeia, com isso surgem os Data Lakes, repositórios de dados com uma estrutura voltada a esse tipo dado, com arquitetura e processos de gestão focados em dados heterogêneos. Portanto, é imprescindível, novos gerenciamentos para esses metadados, novos processos e tecnologias que possam de forma eficiente extrair informações ricas tal qual o gerenciamento tradicional consegue extrair de dados estruturados. Esse trabalho apresenta um estudo sobre o gerenciamento de metadados no contexto de Data Lakes. Foram encontrados 18 estudos que apresentavam relação em diferentes graus com o gerenciamento de metadados e o resultado das análises mostra algumas tendências de boas práticas de gestão no quesito de modelagem, processos e tecnologias. Esse resultado tem grande relevância para auxiliar profissionais e pesquisadores no gerenciamento de metadados em Data Lakes.