Tesis
Corpus de Mensajes Presidenciales de Costa Rica CODIMEP-CR https://sites.google.com/site/mensajepresidencialcr/
Fecha
2011-03-31Autor
Jara Murillo, Carla Victoria
Institución
Resumen
Universidad de Costa Rica – Facultad de Letras
Instituto de Investigaciones Lingüísticas – INIL
Proyecto No. 745-A9-128 Preparación de un corpus digital de mensajes presidenciales costarricenses
CODIMEP-CR
CORPUS DIGITAL DE MENSAJES PRESIDENCIALES DE COSTA RICA https://sites.google.com/site/mensajepresidencialcr/
Investigadora: Carla Victoria Jara Murillo, Ph.D.
Antecedentes
La lingüística de corpus se comienza a desarrollar en el Instituto de Investigaciones Lingüísticas de la Universidad de Costa Rica (INIL) con el proyecto No. 745-A5-206 "Recolección de corpus digitalizados del Instituto de Investigaciones Lingüísticas de la Universidad de Costa Rica" llevado a cabo por el investigador Adrián Vergara Heidke. Su objetivo general era "recolectar un gran corpus lingüístico digitalizado de textos escritos periodísticos, legales y académicos, con el fin de estar disponibles para futuros proyectos de investigación." Como se desprende del objetivo general, este primer proyecto no consideró la inclusión de textos políticos. El resultado fue un corpus digitalizado compuesto por 2628 textos costarricenses (2.126.168 palabras) que incluye 2345 textos periodísticos, 200 textos jurídicos y 83 textos académicos.
Por otra parte, el proyecto No. 745-A4-100 "El discurso político en Costa Rica: evolución y perspectiva" (Investigadora: Carla Victoria Jara Murillo) fue desarrollado durante el período 2004-2009. El objetivo de este proyecto fue "aplicar una metodología propia de los estudios del discurso y fundamentada en la ciencia lingüística a un conjunto de textos políticos para establecer la perspectiva desde la cual, a lo largo del último siglo y hasta el presente, los mandatarios costarricenses han organizado su discurso y las estrategias que han utilizado para lograr sus objetivos." Resultado de este proyecto son los estudios:
Jara Murillo, Carla Victoria. 2006. "Discurso presidencial costarricense: estructura formal y tópica del último mensaje ante los diputados (1902-2002)". Revista de Filología y Lingüística de la Universidad de Costa Rica 32(2): 141-183.
Jara Murillo, Carla Victoria. 2007. "El Mensaje Presidencial costarricense desde la etnografía de la comunicación". Revista de Filología y Lingüística de la Universidad de Costa Rica 33(2):141-178.
Jara Murillo, Carla Victoria. 2008a. “Tópicos y estilos en el epílogo del mensaje presidencial costarricense”. Revista de Filología y Lingüística de la Universidad de Costa Rica 34(1), 97-126.
Jara Murillo, Carla Victoria. 2008b. "Tópicos y funciones comunicativas en los exordios de los Mensajes Presidenciales del 1º de mayo (1902-2002)". Revista Parlamentaria 16(2), 65-117. Asamblea Legislativa de Costa Rica.
Objetivo general
Siguiendo la línea de estudio de la mencionada investigación lingüística sobre el Mensaje Presidencial (MP) costarricense, sumada a un serio interés por desarrollar en nuestro medio la lingüística de corpus, el presente proyecto tiene como objetivo general: "Crear un corpus digital compuesto por los mensajes presidenciales costarricenses desde 1826 hasta el presente".
Objetivos específicos
1. Trasladar a formato digital, mediante escaneo, los mensajes disponibles en las obras
Meléndez Chaverri, Carlos. Compilador. 1981-1991. Mensajes Presidenciales. Tomos I a VIII. Biblioteca de la Academia de Geografía e Historia de Costa Rica. San José: Ed. Texto Ldta. (Tomos I-V); Editorama S.A. (Tomo VI); Imprenta Nacional (Tomos VII-VIII).
Mena Brenes, Marco A. Compilador. 2002. Mensajes Presidenciales. Tomos IX y X. Biblioteca de la Academia de Geografía e Historia de Costa Rica. San José: Imprenta Nacional.
Estas obras alcanzan hasta el año 2002, por lo cual para completar el corpus se recopilaron los mensajes presidenciales del 1º de mayo, así como los de toma de posesión, del período 2002-2010. En total el CODIMEP-CR cuenta con 94 MPs del siglo XIX (para cada uno se incluyen dos archivos separados: trascripción literal del documento original y version literal modernizada), 135 del siglo XX y 13 del siglo XXI, para un total de 242 MPs.
2. Corregir mediante el cotejo con los documentos originales el corpus en crudo obtenido a partir del objetivo 1. Una vez digitalizados los MPs y previo al cotejo con los documentos originales, se procedió a la revisión de los textos procedentes de las fuentes secundarias. A partir de una minuciosa lectura del corpus, se realizaron anotaciones en los siguientes sentidos:
a. Se marcaron en el texto todos los errores evidentes, los cuales luego se verificaron contra las fuentes primarias. Estos errores son básicamente de cuatro tipos:
tipográficos;
ortográficos y de puntuación;
de concordancia;
de omisión (cuando parece faltar una o más palabras) o ambigüedad.
Además se corrigió la segmentación de acuerdo con los textos originales, ya que las fuentes secundarias no siempre reflejan con fidelidad la segmentación original.
b. Con miras a la codificación del corpus mediante un programa de análisis cualitativo, se marcaron dos tipos de segmentos:
Segmentos temáticos de carácter micropolítico (temáticas destacadas por los emisores y referidas a asuntos concretos y puntuales sobre la gestión gubernativa en un momento dado);
Segmentos temáticos de carácter macropolítico (temáticas que reflejan la visión ideológica y política del emisor con respecto a la sociedad y la entidad costarricense en general).
3. Crear un sitio web para dar libre acceso al CODIMEP-CR a través de internet.