Trabajo de grado - Maestría
Automatización de marcado de texto en TEI
Fecha
2023-08-28Registro en:
instname:Universidad de los Andes
reponame:Repositorio Institucional Séneca
Autor
Rivera Parra, Álvaro Andrés
Institución
Resumen
Este trabajo de grado describe la creación de un programa que automatiza la codificación de texto plano a la guía y estándar TEI, a través de peticiones al transformador generativo preentrenado de ChatGPT, mediante su API. En el campo de las humanidades digitales, la digitalización de textos conlleva un proceso de codificación y marcado de texto, que es hecho usualmente de forma manual o con ayuda de editores de texto pagos, lo que conlleva una alta inversión de tiempo, dinero y trabajo. Las directrices TEI son usadas en preservación digital, creación de bases de datos y mejora de búsquedas, colecciones digitales, corpus lingüísticos y libros electrónicos, entre otros. La interfaz de usuario gráfica (GUI) del programa fue hecha con el lenguaje de programación Python, con la librería Tkinter, al igual que el código para realizar las peticiones (prompts) de marcado al, mediante la API de OpenAI.