Brasil
| bachelorThesis
Servidor de Busca SOLR Como Ferramenta na Construção de Sistema de Recuperação de Informação para Teses e Dissertações
Autor
Souza, Luana Talita Mateus de
Institución
Resumen
Investiga a aplicação do software Apache SOLR na construção de sistema de recuperação de informação para teses e dissertações da UFPE. Mais especificamente, consiste na investigação da configuração para construção da base de índices, da busca, do recurso de autossugestão e busca facetada através do software SOLR. As atividades relacionadas consistem nas etapas de identificação da fonte de dados; parametrização do motor de busca (definindo uma estrutura homogênea para estes dados através de um “layout de dados”); configuração do servidor de busca para que este saiba como deve processar a informação de entrada e por fim realizar o trabalho de importação de dados e a criação da coleção. Uma vez criada a coleção contendo metadados de suporte à recuperação da informação, podemos utilizar uma sintaxe particular da ferramenta para realizar o trabalho de busca. Os resultados alcançados mostram que é possível importar os metadados da Biblioteca Digital de Teses e Dissertações (BDTD-UFPE) para o Apache SOLR através da importação pela funcionalidade “DataImport”, utilizando o atual repositório institucional da UFPE. A importação se baseia no protocolo OAI-PMH suportado pelo repositório institucional da UFPE. Através do SOLR é possível configurar para a coleção criada as funcionalidades de autossugestão e busca facetada na recuperação da informação. Os recursos são apresentados num padrão textual de resposta em formatos como XML e json. Foi realizado um experimento utilizando URL’s dos primeiros mil registros obtidos manualmente com o protocolo OAI-PMH. Os recursos de autossugestão e busca facetada podem auxiliar os usuários na recuperação de informação, oferecendo opções de filtragem mais intuitivas e revelar mais informações dos documentos presentes no resultado das buscas. Concluímos que a construção de um SRI através do SOLR pode melhorar a experiência do usuário na busca por informação cientifica nas teses e dissertações da UFPE. This work investigates the use of the Apache SOLR software in the construction of information retrieval system for theses and dissertations from UFPE. More specifically, it is to research parameters settings to build the index base of the search, the autosuggestion feature and faceted search through SOLR software. The related activities consist in identifying steps the data source; search engine parameter (defining a homogeneous structure to this data via a "data layout"); search server configuration so that it knows how to process the input information and finally perform data import work and the creation of the collection. Once you create a collection containing metadata to support information retrieval, we can use a particular syntax tool to perform the search job. The achieved results show that you can import the metadata of the Digital Library of Theses and Dissertations (BDTD-UFPE) to Apache SOLR by the "DataImport" functionality using the current institutional repository of UFPE. The import is based on the OAI-PMH supported by institutional repository of UFPE. By SOLR you can configure for the collection created features of autosuggestion and faceted search in information retrieval. Resources are presented in a textual pattern of response in formats such as XML and JSON. An experiment using URL's of the first thousand records extracted through OAI-PMH protocol was performed. The autosuggestion and faceted searching resources can assist users in information retrieval, offering more intuitive filtering options and reveal more information from these documents on the results of searches. We conclude that the construction of an SRI through SOLR can improve the user experience in the search for scientific information on theses and dissertations of UFPE.