Tesis
Proposta de arquitetura de publicação automatizada de dados abertos conectados utilizando meta-dados e ontologias
Fecha
2019-06-13Registro en:
MARTINS, Luiz Carlos Barbosa. Proposta de arquitetura de publicação automatizada de dados abertos conectados utilizando meta-dados e ontologias. xiv, 80 f., il. Dissertação (Mestrado Profissional em Computação Aplicada)—Universidade de Brasília, Brasília, 2018.
Autor
Martins, Luiz Carlos Barbosa
Institución
Resumen
O governo brasileiro tem investido no aumento da transparência de suas ações visando incentivar a participação ativa da sociedade na gestão. Neste sentido, uma das principais ações é a abertura dos dados de órgãos federais para a comunidade. Hoje existe uma quantidade considerável de dados abertos nos poderes Executivo, Legislativo e Judiciário, além das esferas da União, Estados ou Municípios, mas não existe uma maneira clara de realizar a conexão entre estes dados e a sua publicação. Esta pesquisa visa propor uma arquitetura que auxilie as instituições a abrir seus dados de maneira mais eficiente e agregue o máximo possível de qualidade a eles. A qualidade dos dados está relacionada a dois fatores: o dado ter possibilidade de ser ligado a outros dados e ser o mais atual possível. Assim, propomos um modelo que busca agregar diversas tecnologias que possibilitem que os dados possam ser descritos semanticamente, tornando assim dados conectados e viabilizando as ligações, além de propiciar que os conjuntos de dados possam ser atualizados sem a intervenção humana, garantindo intervalos reduzidos entre publicações. A arquitetura foi dividida em três camadas desacopladas, onde a origem do dado deve ficar a critério da entidade publicadora e o local da publicação final aos usuário final deve ser uma instância da plataforma CKAN. A camada intermediária entre extração dos dados e publicação é realizada pela solução desenvolvida pela pesquisa UnBGOLD que, através da definição de parâmetros específicos, realiza a indexação semântica do dados utilizando um vocabulário controlado, preferencialmente ontologias, e também publica automaticamente os dados no CKAN. Além disso, foi criado de um catálogo de conjuntos de dados também descritos de modo conectado e uma interface para realização de pesquisa pelos conjuntos de dados abertos em que a resposta é enriquecida semanticamente.