Cadlaws: un corpus paralelo de documentos jurídicos equivalentes inglés-francés;
Cadlaws - Un corpus parallèle anglais-français de documents juridiquement équivalents

dc.creatorSole-Mauri, Francina
dc.creatorSánchez-Gijón, Pilar
dc.creatorOliver, Antoni
dc.date2021-07-13
dc.date.accessioned2023-03-16T15:41:18Z
dc.date.available2023-03-16T15:41:18Z
dc.identifierhttps://revistas.udea.edu.co/index.php/mutatismutandis/article/view/345121
dc.identifier.urihttps://repositorioslatinoamericanos.uchile.cl/handle/2250/6232225
dc.descriptionThis article presents Cadlaws, a new English–French corpus built from Canadian legal documents, and describes the corpus construction process and preliminary statistics obtained from it. The corpus contains over 16 million words in each language and includes unique features since it is composed of documents that are legally equivalent in both languages but not the result of a translation. The corpus is built upon enactments co-drafted by two jurists to ensure legal equality of each version and to re­flect the concepts, terms and institutions of two legal traditions. In this article the corpus definition as a parallel corpus instead of a comparable one is also discussed. Cadlaws has been pre-processed for machine translation and baseline Bilingual Evaluation Understudy (bleu), a score for comparing a candidate translation of text to a gold-standard translation of a neural machine translation system. To the best of our knowledge, this is the largest parallel corpus of texts which convey the same meaning in this language pair and is freely available for non-commercial use.en-US
dc.descriptionEste artículo presenta Cadlaws, un nuevo corpus en los pares de lenguas inglés y francés, creado con base en documentos legales canadienses. Describe el proceso de construcción del corpus y las estadís­ticas preliminares que se obtuvieron de aquél. Este corpus contiene más de 16 millones de vocablos en cada idioma e incluye características únicas, pues está conformado por documentos equivalentes desde el punto de vista jurídico en ambos idiomas como lengua de partida. El corpus se basó en autos legales redactados de manera conjunta por dos juristas para garantizar la equivalencia jurídica de cada versión y reflejar los conceptos, términos e instituciones de dos tradiciones del derecho. En este artículo, también se estudia la definición de corpus como corpus paralelo en oposición al corpus comparable. Cadlaws se procesó previamente para traducción automática y el suplente de evaluación bilingüe de referencia (bleu, por sus siglas en inglés), un puntaje que sirve para comparar un texto presentado como candidato para la traducción de un texto contra una traducción considerada patrón de referencia en un sistema de traducción automática neuronal. Hasta donde sabemos, este es el corpus paralelo de textos con el mismo significado en este par de lenguas más extenso que existe, y ofrece libre acceso para uso no comercial.es-ES
dc.descriptionCet article présente Cadlaws, un nouveau corpus anglais-français construit à partir de documents juri­diques canadiens. L’article décrit le processus de construction du corpus ainsi que les statistiques pré­liminaires obtenues à partir de celui-ci. Le corpus contient plus de 16 millions de mots dans chaque langue et présente des caractéristiques uniques puisqu’il est composé de documents juridiquement équivalents dans les deux langues mais qui ne sont pas le résultat d’une traduction. Le corpus est construit à partir de textes co-rédigés par deux juristes afin de garantir l’égalité juridique de chaque version et de refléter les concepts, termes et institutions de deux traditions juridiques. Dans cet article, la définition du corpus comme un corpus parallèle au lieu d’un corpus comparable est également discutée. Cadlaws a été prétraité pour la traduction automatique et offre la valeur d’évaluation bleu (Bilingual Evaluation Understudy), un score permettant de comparer une traduction avec la norme d’un système de traduction automatique neuronal. À notre connaissance, il s’agit du plus grand cor­pus parallèle de textes véhiculant le même sens dans cette paire de langues et il est disponible gratui­tement pour une utilisation non commerciale.fr-CA
dc.formatapplication/pdf
dc.languageeng
dc.publisherUniversidad de Antioquiaes-ES
dc.relationhttps://revistas.udea.edu.co/index.php/mutatismutandis/article/view/345121/20805814
dc.rightsDerechos de autor 2021 Mutatis Mutandis. Revista Latinoamericana de Traducciónes-ES
dc.rightshttps://creativecommons.org/licenses/by-nc-sa/4.0es-ES
dc.sourceMutatis Mutandis. Revista Latinoamericana de Traducción; Vol. 14 No. 2 (2021): Nuevas perspectivas de investigación en la traducción especializada en lenguas románicas: aspectos comparativos, léxicos, fraseológicos, discursivos y didácticos; 494-508en-US
dc.sourceMutatis Mutandis. Revista Latinoamericana de Traducción; Vol. 14 Núm. 2 (2021): Nuevas perspectivas de investigación en la traducción especializada en lenguas románicas: aspectos comparativos, léxicos, fraseológicos, discursivos y didácticos; 494-508es-ES
dc.sourceMutatis Mutandis. Revista Latinoamericana de Traducción; Vol. 14 No. 2 (2021): Nuevas perspectivas de investigación en la traducción especializada en lenguas románicas: aspectos comparativos, léxicos, fraseológicos, discursivos y didácticos; 494-508fr-CA
dc.sourceMutatis Mutandis. Revista Latinoamericana de Traducción; v. 14 n. 2 (2021): Nuevas perspectivas de investigación en la traducción especializada en lenguas románicas: aspectos comparativos, léxicos, fraseológicos, discursivos y didácticos; 494-508pt-BR
dc.source2011-799X
dc.subjectcorpus constructionen-US
dc.subjectparallel corpusen-US
dc.subjectNeural Machine Translation (NMT)en-US
dc.subjectEnglish–French translationen-US
dc.subjectCadlawsen-US
dc.subjectCorpora (Linguistics)en-US
dc.subjectParallel corporaen-US
dc.subjectMachine translatingen-US
dc.subjectEnglish languaje - translations into frenchen-US
dc.subjectFrench language - translations into englishen-US
dc.subjectconstrucción de corpuses-ES
dc.subjectcorpus paraleloes-ES
dc.subjecttraducción automática neuronal (TA)es-ES
dc.subjectinglés-francéses-ES
dc.subjectCadlawses-ES
dc.subjectCorpus lingüísticoes-ES
dc.subjectCorpus paraleloes-ES
dc.subjectTraducción automáticaes-ES
dc.subjectInglés - Traducciones al francéses-ES
dc.subjectFrancés - Traducciones al ingléses-ES
dc.subjectconstruction de corpusfr-CA
dc.subjectcorpus parallèlefr-CA
dc.subjecttraduction automatique neuronale (nmt)fr-CA
dc.subjectanglaisfr-CA
dc.subjectfrançaisfr-CA
dc.subjectCadlawsfr-CA
dc.subjectCorpus linguistiquefr-CA
dc.subjectCorpus parallèlefr-CA
dc.subjectTraduction automatiquefr-CA
dc.subjectTraductions anglais - françaisfr-CA
dc.subjectTraductions français - anglaisfr-CA
dc.titleCadlaws – An English–French Parallel Corpus of Legally Equivalent Documentsen-US
dc.titleCadlaws: un corpus paralelo de documentos jurídicos equivalentes inglés-francéses-ES
dc.titleCadlaws - Un corpus parallèle anglais-français de documents juridiquement équivalentsfr-CA
dc.typeinfo:eu-repo/semantics/article
dc.typeinfo:eu-repo/semantics/publishedVersion
dc.typetexten-US
dc.typeArtículos revisados por pareses-ES
dc.typetextoes-ES
dc.typetextefr-CA


Este ítem pertenece a la siguiente institución