info:eu-repo/semantics/article
Analysis of the information retrieval process in databases published as linked open data using the RDB2LOD approach
Análise do processo de recuperação da informação em bases de dados publicadas como dados abertos ligados utilizando a abordagem RDB2LOD
Autor
Martins Pereira, Clayton
Ferneda, Edberto
Santarem Segundo, José Eduardo
Resumen
Linked Open Data has become a standard for data publishing and data enrichment, and it supports the transition from a document-driven Web to an interconnected Web of data and thus to the Semantic Web. On the other hand, relational databases make up the core of most information systems currently in operation due to their maturity and efficiency in the form of storing and querying data. Thus, publishing the vast amount of data maintained in relational databases around the world in line with the good practices and recommendations of Linked Data can contribute significantly to the widespread adoption of Semantic Web tools and technologies. It is in this context that appeared the RDB2LOD approach for publishing Linked Open Data obtained from relational databases. However, once data is effectively published, the next step is efficiently and accurately searching and retrieving it for suitable use. This qualitative and exploratory work aims to analyze the information retrieval process in the RDB2LOD approach, in order to find out if the use of this approach can help to formulate SPARQL queries and, consequently, to improve the visualization and exploration of the retrieved data. For this, a bibliographic and documentary study was carried out, along with an experiment where the RDB2LOD approach’s information retrieval process was evaluated in two different cases. It was demonstrated that the consideration of the semantic aspects of terms in query expressions and the application of ontologies might improve data retrieval efficiency and accuracy. Os dados abertos ligados têm se tornado um padrão para publicação e enriquecimento de dados, o que promove a transição de uma Web orientada a documentos para uma Web de dados e, por conseguinte, para a Web Semântica. Por outro lado, bases de dados relacionais compõem o núcleo da maioria dos sistemas de informação atualmente em operação. Assim, a publicação da imensa quantidade de dados mantidos em bases de dados relacionais, seguindo as boas práticas e recomendações do Linked Data, pode contribuir significativamente para a consolidação das ferramentas e tecnologias da Web Semântica. É nesse contexto que surgiu a abordagem RDB2LOD para publicação de dados abertos ligados obtidos a partir de bases de dados relacionais. Porém, depois de os dados serem efetivamente publicados, o passo seguinte é recuperá-los de forma eficiente para o seu devido consumo. Este trabalho, de natureza qualitativa e do tipo exploratório, tem como objetivo fazer uma análise do processo de recuperação da informação na abordagem RDB2LOD, a fim de averiguar se a utilização desta abordagem pode facilitar a formulação de consultas SPARQL e, consequentemente, melhorar a visualização e exploração dos dados recuperados. Para isso foi realizada uma pesquisa bibliográfica e documental, além de um experimento no qual a abordagem teve seu processo de recuperação da informação avaliado em dois casos distintos. Ficou demonstrado que, ao levar em consideração os aspectos semânticos dos termos empregados nas expressões de consulta, por meio da aplicação de ontologias, é possível tornar mais eficiente e precisa a recuperação de dados.