Tesis
Estrutura SINTR+
Autor
Mechereffe, Cláudia Maksud
Institución
Resumen
Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico. Programa de Pós-Graduação em Ciência da Computação. Este trabalho tem como objetivo apresentar um novo modelo de sistema informatizado de suporte ao usuário no processo de recuperação de informações. A proposta consiste em apoio durante a definição da query de busca e baseia-se na identificação das possibilidades de sistematização e junção do modelo de Kuramoto com a estrutura de Gonzalez. Para a sua construção foi necessário analisar e sintetizar o modelo de suporte ao usuário de Kuramoto (baseado na determinação dos Sintagmas Nominais), a estrutura de Qualia do Léxico Gerativo de Pustejovsky e, termos e RLBs (relações lexicais binárias) do modelo TR+ de Gonzalez. O resultado que se espera alcançar é possibilitar a realização de uma interação que venha a proporcionar uma negociação adequada dos significados entre o usuário e a máquina, negociação essa que deve resultar em fator fundamental na melhoria da eficiência dos processos de busca. O modelo de Kuramoto, baseado em uma hierarquia de Sintagmas Nominais, suporta inicialmente essa interação. Com a definição da query de busca e da Estrutura de Qualia de Pustejovsky, implícita no modelo TR+ de Gonzalez, foi possível obter uma maior relevância dos documentos recuperados através de um cálculo de peso de descritores (termos e relacionamentos) evidentes nos documentos. As etapas gerais do modelo proposto são: a extração de Sintagmas Nominais e a sua hierarquização automática em níveis, o pré-processamento (toquenização e etiquetagem), o processo de nominalização e a captura de RLBs. Delineado preliminarmente o modelo partiu-se para as etapas de levantamento e análise de requisitos, representada pelos diagramas e pelas descrições dos casos de uso, chegando-se ao desenvolvimento do seu modelo conceitual que culminou a construção dos diagramas de classes e de seqüência para a aplicação proposta. Ao final conclui-se que a alternativa indicada neste trabalho, além de ser exeqüível, apresenta ganhos qualitativos nos resultados de uma busca em recuperação de informações e, também, quantitativos, no que se refere a um menor tempo na fase de indexação (rapidez) e um tamanho menor de arquivos de índice gerados (memória).