Improving the multiword expression treatment in a rule-based machine translator

dc.contributorVillavicencio, Aline
dc.creatorBeck, Daniel Emilio
dc.date2010-02-19T04:14:42Z
dc.date2009
dc.identifierhttp://hdl.handle.net/10183/18528
dc.identifier000730572
dc.descriptionA Tradução Automática (TA) é uma das aplicações mais clássicas do Processamento da Língua Natural (PLN). As pesquisas nessa área geraram uma série de ferramentas e sistemas usados largamente hoje em dia. No entanto, na maior parte das aplicações, as traduções geradas por esses sistemas não são da qualidade exigida, sendo necessário um processo posterior de revisão. Uma das formas de melhorar os sistemas de TA é utilizar recursos linguísticos, como dicionários e ontologias. A idéia deste trabalho é aprimorar um sistema existente adicionando um dicionário de Expressões Multipalavras (EMPs), um fenômeno linguístico de grande importância para aplicações de PLN. Neste trabalho foi proposta uma abordagem para o tratamento de EMPs em um sistema de Tradução Automática, o Apertium, através da representação adequada das mesmas. O impacto causado pela adoção desta abordagem foi avaliado no contexto de TA com o par de línguas Inglês-Espanhol.
dc.descriptionMachine Translation (MT) is one of the most classic Natural Language Processing (NLP) applications. Research in this area generated a series of tools and systems widely used today. However, in most applications, the translations generated by these systems do not have the demanded quality, requiring a subsequent review process. One way to improve MT systems is to use linguistic resources, such as dictionaries and ontologies. The idea of this work is to improve an existing system by adding a dictionary of Multiword Expressions (MWEs), a linguistic phenomenon of great importance for NLP applications. In this work, we propose an approach for the EMPs treatment in a Machine Translation system, Apertium, through appropriate representation of the same. The impact caused by the adoption of this approach was evaluated in the MT context with the language pair English-Spanish.
dc.formatapplication/pdf
dc.languagepor
dc.rightsOpen Access
dc.subjectNatural language processing
dc.subjectComputational linguistics
dc.subjectMultiword expressions
dc.subjectMachine translation
dc.subjectLinguagem natural
dc.subjectLinguística computacional
dc.titleAprimorando o tratamento de expressões multipalavras em um tradutor automatico baseado em regras
dc.titleImproving the multiword expression treatment in a rule-based machine translator
dc.typeTrabalho de conclusão de graduação


Este ítem pertenece a la siguiente institución