Cross-language information retrieval using algorithms for mining association rules

dc.contributorMoreira, Viviane Pereira
dc.contributorHeuser, Carlos Alberto
dc.creatorGeraldo, André Pinto
dc.date2010-10-29T11:11:01Z
dc.date2009
dc.identifierhttp://hdl.handle.net/10183/26506
dc.identifier000759666
dc.descriptionEste trabalho propõe a utilização de algoritmos de mineração de regras de associação para a Recuperação de Informações Multilíngues. Esses algoritmos têm sido amplamente utilizados para analisar transações de registro de vendas. A ideia é mapear o problema de encontrar associações entre itens vendidos para o problema de encontrar termos equivalentes entre idiomas diferentes em um corpus paralelo. A proposta foi validada por meio de experimentos com diferentes idiomas, conjuntos de consultas e corpora. Os resultados mostram que a eficácia da abordagem proposta é comparável ao estado da arte, ao resultado monolíngue e à tradução automática de consultas, embora este utilize técnicas mais complexas de processamento de linguagem natural. Foi criado um protótipo que faz consultas à Web utilizando o método proposto. O sistema recebe palavras-chave em português, as traduz para o inglês e submete a consulta a diversos sites de busca.
dc.descriptionThis work proposes the use of algorithms for mining association rules as an approach for Cross-Language Information Retrieval. These algorithms have been widely used to analyze market basket data. The idea is to map the problem of finding associations between sales items to the problem of finding term translations over a parallel corpus. The proposal was validated by means of experiments using different languages, queries and corpora. The results show that the performance of our proposed approach is comparable to the performance of the monolingual baseline and to query translation via machine translation, even though these systems employ more complex Natural Language Processing techniques. A prototype for cross-language web querying was implemented to test the proposed method. The system accepts keywords in Portuguese, translates them into English and submits the query to several web-sites that provide search functionalities.
dc.formatapplication/pdf
dc.languagepor
dc.rightsOpen Access
dc.subjectRecuperacao : Informacao
dc.subjectBanco : Dados
dc.subjectMineracao : Dados
dc.subjectInformation retrieval
dc.subjectCross-language information retrieval
dc.subjectAssociation rules
dc.titleAplicando algoritmos de mineração de regras de associação para recuperação de informações multilíngues.
dc.titleCross-language information retrieval using algorithms for mining association rules
dc.typeDissertação


Este ítem pertenece a la siguiente institución