info:eu-repo/semantics/article
A Method for Translating Multiword Terms Using Corpora
Metodología para la traducción de términos compuestos mediante corpus;
Méthodologie pour la traduction des termes complexes à partir de corpus
Autor
Cabezas García, Melania
Institución
Resumen
Multiword terms (MWTS) are one of the main stumbling blocks in specialized translation. Translators and terminologists must master a variety of techniques to find their interlinguistic equivalents, because they are not always well described or even included in most terminological resources. Parallel texts, which are very useful for terminology extraction and knowledge acquisition, are usually employed for these purposes. They can be compiled in the form of comparable corpora, which are collections of texts originally written in the source and target languages. To make the most of them, translators must master advanced corpus query techniques. Unfortunately, this is not always the case. This paper presents a corpus-based methodology that facilitates the identification of English equivalents of Spanish MWTS and provides terminologists and translators with manual corpus query techniques that simplify the translation of MWTS. A comparable corpus formed by original Spanish and English texts on wind power was analyzed for the purposes of the study. We proposed a translation methodology based on distributional semantics, which entailed the obtention and comparison of contextual elements of the concepts in the source and target languages. Our results showed that this technique facilitates the identification of MWT translation equivalents in corpus. Los términos compuestos son una de las principales dificultades en la traducción de los textos especializados. Dado que estos términos no siempre figuran en los recursos terminológicos o lo hacen de forma poco exhaustiva, los traductores y terminólogos deben dominar diversas técnicas para resolver sus dificultades. Tradicionalmente, se han utilizado textos paralelos para extraer terminología y adquirir conocimientos especializados. Estos textos pueden compilarse en forma de corpus comparables (es decir, textos escritos originalmente en la lengua de origen y de llegada), que pueden utilizarse para explotar un mayor número de textos de manera más eficiente. No obstante, a menudo hay reticencia a su utilización, en algunos casos debido a la falta de conocimiento de las técnicas de consulta. En este estudio se describe una metodología para identificar en corpus comparables los equivalentes en inglés de los términos compuestos en español, con vistas a: 1) facilitar esta tarea en la labor cotidiana de los traductores y terminólogos; y 2) proporcionarles técnicas de extracción manual en corpus. Con este fin, analizamos un corpus comparable de textos especializados sobre energía eólica escritos originalmente en español e inglés. La metodología propuesta se basa en la semántica distribucional y consiste en la identificación y la comparación de elementos contextuales de los conceptos en ambos idiomas. Los resultados muestran que este procedimiento simplifica la identificación de equivalentes de los términos compuestos en corpus. La qualité d’une traduction spécialisée dépend en grande partie de la bonne gestion des termes complexes. Étant donné que ceux-ci n’apparaissent pas toujours dans les ressources terminologiques et qu’ils sont décrits de manière non exhaustive, les traducteurs et les terminologues doivent maîtriser diverses techniques pour résoudre leurs difficultés. Traditionnellement, les textes parallèles ont été utilisés pour extraire la terminologie et acquérir des connaissances spécialisées. Ces textes peuvent être compilés sous la forme de corpus comparables (c’est-à-dire, des textes écrits à l’origine dans chaque langue), ce qui permet d’exploiter plus efficacement un plus grand nombre de textes. Cependant, on hésite souvent à les utiliser, probablement en raison d’un manque de connaissance des techniques de requête. Cette étude décrit une méthodologie permettant d’identifier dans un corpus comparable les équivalents anglais des termes complexes espagnols, en vue (i) de faciliter cette tâche dans le travail quotidien des traducteurs et des terminologues, et (ii) de leur fournir des techniques de requête manuelle de corpus. À cette fin, nous avons compilé un corpus comparable de textes spécialisés sur l’énergie éolienne, rédigés à l’origine en espagnol et en anglais. La méthodologie proposée s’inspire de la sémantique distributionnelle et consiste à identifier et à comparer les éléments contextuels des concepts dans les deux langues. Les résultats ont montré que cette procédure simplifie l’identification des équivalents des termes complexes dans les corpus.
Materias
Ítems relacionados
Mostrando ítems relacionados por Título, autor o materia.
-
Corpus stylistics: bridging the gap between linguistic and literary studies
Mahlberg, Michaela; Carneiro, Raphael Marco Oliveira; Novodvorski, Ariel