dc.contributor | Melgar Sasieta, Héctor Andrés | |
dc.contributor | Oncevay Marcos, Félix Arturo | |
dc.creator | Galarreta Asian, Ana Paula | |
dc.date | 2017-03-31T21:15:54Z | |
dc.date | 2017-03-31T21:15:54Z | |
dc.date | 2017 | |
dc.date | 2017-03-31 | |
dc.date | 2018-01-01 | |
dc.identifier | http://hdl.handle.net/20.500.12404/8325 | |
dc.description | Actualmente, existe información que debe estar disponible para todos los habitantes de
nuestro país, tales como textos educativos, leyes y noticias. Sin embargo, a pesar que el Perú es un
país multilingüe, la mayoría de textos se encuentran redactados únicamente en español. Una de las
razones por las que no se traducen estos textos a otras lenguas habladas en nuestro país es porque
el proceso es costoso y requiere de mucho tiempo. Por este motivo se propone desarrollar un
traductor automático basado en colecciones de textos, también llamados corpus, que utilice
métodos estadísticos y pueda servir de apoyo una plataforma de software de traducción automática
de texto entre el español y el shipibo-konibo.
Para implementar un método estadístico, es necesario contar con corpus paralelos en los
idiomas a traducir. Esto representa un problema, pues existen muy pocos textos escritos en shipibokonibo,
y la mayoría de estos no cuenta con una traducción al español. Por este motivo es necesario
construir corpus paralelos en base a dos procesos: la traducción de textos del shipibo-konibo al
español (y viceversa) y la alineación semi-automática de los textos bilingües disponibles. Con los
corpus paralelos obtenidos, se puede entrenar y validar un traductor automático, a fin de encontrar
los parámetros que generan las mejores traducciones. Además, en base a los resultados obtenidos,
se determinará la etapa en la que el traductor estadístico se integrará a la plataforma de software de
traducción automática que será implementada por investigadores del Grupo de Reconocimiento de
Patrones e Inteligencia Artificial Aplicada (GRPIAA) y el departamento de lingüística de la PUCP. | |
dc.description | Tesis | |
dc.format | application/pdf | |
dc.language | spa | |
dc.publisher | Pontificia Universidad Católica del Perú | |
dc.publisher | PE | |
dc.rights | Atribución-NoComercial-SinDerivadas 2.5 Perú | |
dc.rights | info:eu-repo/semantics/openAccess | |
dc.rights | http://creativecommons.org/licenses/by-nc-nd/2.5/pe/ | |
dc.subject | Traductores--Programas para computadoras | |
dc.subject | Traductores--Métodos estadísticos | |
dc.subject | Traductores--Shipibo-Conibo | |
dc.subject | Traductores--Lenguas indígenas | |
dc.subject | Traductores--Español | |
dc.subject | https://purl.org/pe-repo/ocde/ford#1.02.00 | |
dc.title | Generación de corpus paralelos para la implementación de un traductor automático estadístico entre shipibo-konibo y español | |
dc.type | info:eu-repo/semantics/masterThesis | |