bachelorThesis
Avaliação de Sistemas de Indexação Automática Aplicados a Artigos Científicos na Área de Ciência da Informação
Autor
Torres, Nathally Stephanie de Melo
Institución
Resumen
Avalia sistemas de indexação automática em um corpus em português de artigos científicos na área de Ciência da Informação. Como objetivos específicos: investiga a avaliação de software que realize a indexação automática; constrói um corpus em português de artigos científicos na área de Ciência da Informação; propõe método de avaliação de sistemas de indexação automática associado ao corpus criado; avalia comparativamente sistemas de indexação automática presentes na literatura científica quanto à qualidade na indexação automática do corpus proposto. A pesquisa tem caráter exploratório quanto aos objetivos, e quanto aos métodos a pesquisa tem caráter bibliográfico e experimental. O experimento computacional consistiu em analisar comparativamente a consistência, precisão, revocação e medida F obtidas na indexação automática do corpus pelos softwares SISA e OGMA. A partir da comparação dos resultados obtidos pelos sistemas de indexação automática avaliados, pode-se perceber que o SISA se sobressaiu ao OGMA em consistência, precisão e medida F, já o OGMA apresentou melhor revocação. Conclui-se que o SISA é o melhor sistema de indexação automática, não descartando a necessidade de aperfeiçoamento de ambos os sistemas. This work evaluates automatic indexing systems in a Portuguese corpus of scientific articles of the area of Information Science. As specific objectives: investigates the evaluation of software that performs automatic indexing; constructs a corpus in Portuguese of scientific articles in the area of Information Science; proposes method of evaluation of automatic indexing systems associated with the created corpus; evaluates comparatively automatic indexing systems present in the scientific literature regarding the quality in the automatic indexing of the proposed corpus. The research has an exploratory character regarding the objectives, and the methods the research has bibliographic and experimental character. The computational experiment consisted of comparing the consistency, precision, recall and f-measure obtained in the automatic indexing of the corpus by the softwares SISA and OGMA. From the comparison of the results obtained by the automatic indexing systems evaluated, it can be seen that the SISA is superior to OGMA in consistency, precision and f-measure, beside OGMA has better recall than SISA. It is concluded that SISA is the best automatic indexing system, not ruling out the need for improvements of both systems.