masterThesis
Um sistema de recuperação e extração de informação utilizando conceitos da web semântica
Registro en:
Cunha Cardoso, Rafael; Carolina Brandão Salgado, Ana. Um sistema de recuperação e extração de informação utilizando conceitos da web semântica. 2004. Dissertação (Mestrado). Programa de Pós-Graduação em Ciência da Computação, Universidade Federal de Pernambuco, Recife, 2004.
Autor
CARDOSO, Rafael Cunha
Institución
Resumen
A crescente quantidade de dados disposta diariamente na Web faz com que os
sistemas de recuperação e extração de informações desempenhem um papel importante
dentro dessa realidade. Entretanto, os resultados das buscas na Web freqüentemente
frustram as expectativas dos usuários no tocante à qualidade das informações recuperadas.
A Web Semântica, considerada a nova geração da Web, apresenta conceitos e ferramentas
que visam inserir significado nos documentos existentes na WWW atual, permitindo com
isso sanar algumas das limitações existentes. Um dos principais conceitos sobre os quais a
Web Semântica se fundamenta, é a Ontologia. Estas podem ser vistas como especificações
formais de um determinado domínio de conhecimento que possibilitam um entendimento
comum sobre determinado tema de discussão.
Este trabalho visa melhorar a qualidade das informações recuperadas de sites na
Web através da utilização de conceitos e fundamentos da Web Semântica aliada às técnicas
da Web já estabilizadas. Para tanto, foi definida uma arquitetura e desenvolvido um
protótipo de um sistema que objetiva realizar recuperação e extração de dados sobre um
domínio específico de conhecimento, utilizando uma ontologia (baseada nos fundamentos
da Web Semântica) desenvolvida para auxiliar o processo de extração de informação
relevante a partir de um conjunto específico de dados da Web.