dc.contributor | Vaughan Caro, Nicolás | |
dc.contributor | Roa Garcés, Nathalia | |
dc.contributor | Martínez Peñaloza, Germán Camilo | |
dc.creator | Rivera Parra, Álvaro Andrés | |
dc.date.accessioned | 2023-08-29T12:54:59Z | |
dc.date.accessioned | 2023-09-06T23:54:39Z | |
dc.date.available | 2023-08-29T12:54:59Z | |
dc.date.available | 2023-09-06T23:54:39Z | |
dc.date.created | 2023-08-29T12:54:59Z | |
dc.date.issued | 2023-08-28 | |
dc.identifier | http://hdl.handle.net/1992/70089 | |
dc.identifier | instname:Universidad de los Andes | |
dc.identifier | reponame:Repositorio Institucional Séneca | |
dc.identifier | repourl:https://repositorio.uniandes.edu.co/ | |
dc.identifier.uri | https://repositorioslatinoamericanos.uchile.cl/handle/2250/8726951 | |
dc.description.abstract | Este trabajo de grado describe la creación de un programa que automatiza la codificación de texto plano a la guía y estándar TEI, a través de peticiones al transformador generativo preentrenado de ChatGPT, mediante su API. En el campo de las humanidades digitales, la digitalización de textos conlleva un proceso de codificación y marcado de texto, que es hecho usualmente de forma manual o con ayuda de editores de texto pagos, lo que conlleva una alta inversión de tiempo, dinero y trabajo. Las directrices TEI son usadas en preservación digital, creación de bases de datos y mejora de búsquedas, colecciones digitales, corpus lingüísticos y libros electrónicos, entre otros. La interfaz de usuario gráfica (GUI) del programa fue hecha con el lenguaje de programación Python, con la librería Tkinter, al igual que el código para realizar las peticiones (prompts) de marcado al, mediante la API de OpenAI. | |
dc.language | spa | |
dc.publisher | Universidad de los Andes | |
dc.publisher | Maestría en Humanidades Digitales | |
dc.publisher | Facultad de Artes y Humanidades | |
dc.publisher | Centro de Estudios en Periodismo ¿ Ceper | |
dc.relation | Alammar, J. (s/f). The Illustrated GPT-2 (Visualizing Transformer Language Models). Recuperado el 4 de junio de 2023, de http://jalammar.github.io/illustrated-gpt2/ | |
dc.relation | Hamidovi¿, D., Clivaz, C., & Savant, S. B. (s/f). Using Natural Language Processing to Search for Textual References Title: Ancient Manuscripts in Digital Culture Book Subtitle: Visualisation, Data Mining, Communication. https://doi.org/10.1163/j.ctvrxk44t.11 | |
dc.relation | Bang, Y., Cahyawijaya, S., Lee, N., Dai, W., Su, D., Wilie, B., Lovenia, H., Ji, Z., Yu, T., Chung, W., Do, Q. V., Xu, Y., & Fung, P. (2023). A Multitask, Multilingual, Multimodal Evaluation of ChatGPT on Reasoning, Hallucination, and Interactivity (arXiv:2302.04023). arXiv. http://arxiv.org/abs/2302.04023 | |
dc.relation | Bowers, J., & Romary, L. (2018). Bridging the Gaps between Digital Humanities, Lexicography, and Linguistics: A TEI Dictionary for the Documentation of Mixtepec-Mixtec. Dictionaries: Journal of the Dictionary Society of North America, 39(2), 79¿106. https://doi.org/10.1353/dic.2018.0022 | |
dc.relation | Burnard, L. (2022). ¿Qué es la Iniciativa de Codificación de Textos?: Cómo añadir marcado inteligente a los recursos digitales (N. Vaughan, Trad.). Open Edition Press. https://doi.org/10.4000/books.oep.15662 | |
dc.relation | Del Río, G. (2019, diciembre 6). Humanidades Digitales, infraestructuras visibles e invisibles. Humanidades Digitales, infraestructuras visibles e invisibles. https://hdlabconicet.github.io/HD-infraestructuras/ | |
dc.relation | Don, Z. M., & Knowles, G. (2021). The digital humanities and re-imagined language description: A linguistic model of Malay with potential for other languages. Digital Scholarship in the Humanities. https://doi.org/10.1093/llc/fqab101 | |
dc.relation | Geewax, J. J., & Skeet, J. (2021). API design patterns. Manning. | |
dc.relation | Hammond, M. (2020). Python for Linguists. Cambridge University Press; Cambridge Core. https://doi.org/10.1017/9781108642408 | |
dc.relation | DeepLearningAI. (2023, mayo 17). Google Goes All-In on AI, Do You Share GPT-3s Politics?, and more. Google Goes All-In on AI, Do You Share GPT-3s Politics?, And More. https://www.deeplearning.ai/the-batch/issue-197/ | |
dc.relation | Ide, N., & Pustejovsky, J. (Eds.). (2017). Handbook of Linguistic Annotation. Springer Netherlands. https://doi.org/10.1007/978-94-024-0881-2 | |
dc.relation | Jensen, K. E. (2014). Linguistics and the digital humanities: SMID, 57, 20. | |
dc.relation | Krohn, J., Beyleveld, G., & Bassens, A. (2020). Deep learning illustrated: A visual, interactive guide to artificial intelligence (1st edition). Addison-Wesley. | |
dc.relation | Li, H. (2019). Research Methods for the Digital Humanities. Lewis Levenberg, Tai Neilson and David Rheams (eds.). Digital Scholarship in the Humanities, 34(3), 699-701. https://doi.org/10.1093/llc/fqz049 | |
dc.relation | Loukides, M. (2023). What Are ChatGPT and Its Friends? O'Reilly Media, Inc. https://learning.oreilly.com/library/view/what-are-chatgpt/9781098152604/ch01.html | |
dc.relation | Manning, C. D., & Schiitze, H. (s/f). Foundations of Statistical Natural Language Processing. | |
dc.relation | McShane, M., & Nirenburg, S. (2021a). Linguistics for the Age of AI. En Linguistics for the Age of AI. The MIT Press. https://doi.org/10.7551/mitpress/13618.001.0001 | |
dc.relation | Mehl, S. (2021). Why Linguists Should Care about Digital Humanities (and Epidemiology). Journal of English Linguistics, 49(3), 331-337. https://doi.org/10.1177/00754242211019072 | |
dc.relation | Mylonas, E., & Renear, A. (1999). The Text Encoding Initiative at 10: Not Just an Interchange Format Anymore ¿ But a New Research Community. Computers and the Humanities, 33(1), 1-9. https://doi.org/10.1023/A:1001832310939 | |
dc.relation | OpenAI Cookbook. (2023). [Jupyter Notebook]. OpenAI. https://github.com/openai/openai-cookbook (Obra original publicada en 2022) | |
dc.relation | Ouyang, L., Wu, J., Jiang, X., Almeida, D., Wainwright, C. L., Mishkin, P., Zhang, C., Agarwal, S., Slama, K., Ray, A., Schulman, J., Hilton, J., Kelton, F., Miller, L., Simens, M., Askell, A., Welinder, P., Christiano, P., Leike, J., & Lowe, R. (2022). Training language models to follow instructions with human feedback (arXiv:2203.02155). arXiv. http://arxiv.org/abs/2203.02155 | |
dc.relation | Ozdemir, S. (2023). Quick Start Guide to Large Language Models: Strategies and Best Practices for Using ChatGPT and Other LLMs. Pearson Education (US). https://books.google.com.co/books?id=U6HWzwEACAAJ | |
dc.relation | Open AI. (2023). Pricing. Recuperado el 15 de junio de 2023, de https://openai.com/pricing#language-models | |
dc.relation | RedHat (2023). ¿Qué es la automatización? Ventajas e importancia de automatizar. (s/f). Recuperado el 9 de junio de 2023, de https://www.redhat.com/es/topics/automation | |
dc.relation | Roy, N., & Forget, B. (2019). MIT Schwarzman College of Computing Task Force Working Group on Computing Infrastructure Final Report. http://web.mit.edu/comptfreport/infrastructure.pdf | |
dc.relation | Sanh, V., Webson, A., Raffel, C., Bach, S. H., Sutawika, L., Alyafeai, Z., Chaffin, A., Stiegler, A., Scao, T. L., Raja, A., Dey, M., Bari, M. S., Xu, C., Thakker, U., Sharma, S. S., Szczechla, E., Kim, T., Chhablani, G., Nayak, N., Rush, A. M. (2022). Multitask Prompted Training Enables Zero-Shot Task Generalization (arXiv:2110.08207). arXiv. http://arxiv.org/abs/2110.08207 | |
dc.relation | Shen, Y., Song, K., Tan, X., Li, D., Lu, W., & Zhuang, Y. (2023). HuggingGPT: Solving AI Tasks with ChatGPT and its Friends in Hugging Face. | |
dc.relation | Sperberg-McQueen, C. M. Text in the Electronic Age: Texual Study and Textual Study and Text Encoding, with Examples from Medieval Texts, Literary and Linguistic Computing, Volumen 6, Número 1, 1991, pp. 34-46, https://doi.org/10.1093/llc/6.1.34 | |
dc.relation | Silva, J. A. /2017a). A un pesimista / José Asunción Silva. https://catalogoenlinea.bibliotecanacional.gov.co/client/es_ES/search/asset/173608/0 | |
dc.relation | Silva, J. A. /2017b). Nocturno / José Asunción Silva. https://catalogoenlinea.bibliotecanacional.gov.co/client/es_ES/search/asset/169473/0 | |
dc.relation | Silva, J. A. /2017c). Nidos / José Asunción Silva. https://catalogoenlinea.bibliotecanacional.gov.co/client/es_ES/search/asset/169436/0 | |
dc.relation | Silva, J. A. /2017d). Estrofas / José Asunción Silva. https://catalogoenlinea.bibliotecanacional.gov.co/client/es_ES/search/asset/169505/0 | |
dc.relation | Silva, J. A. /2017e). Nocturno III /José Asunción Silva. https://catalogoenlinea.bibliotecanacional.gov.co/client/es_ES/search/asset/169473/0 | |
dc.relation | Silva, J. A. (2017f). Psicopatía /José Asunción Silva. https://catalogoenlinea.bibliotecanacional.gov.co/client/es_ES/search/asset/169700/0 | |
dc.relation | Silva, J. A. (2017g). Vejeces / José Asunción Silva. https://catalogoenlinea.bibliotecanacional.gov.co/client/es_ES/search/asset/174203/0 | |
dc.relation | Silva, J. A. (2017h). Las crisálidas / José Asunción Silva. https://catalogoenlinea.bibliotecanacional.gov.co/client/es_ES/search/asset/169756/0 | |
dc.relation | Silva, J. A. (2017i). Primera comunión / José Asunción Silva. https://catalogoenlinea.bibliotecanacional.gov.co/client/es_ES/search/asset/169241/0 | |
dc.relation | Silva, J. A. (2017j). Sus dos mesas / José Asunción Silva. https://catalogoenlinea.bibliotecanacional.gov.co/client/es_ES/search/asset/170888/0 | |
dc.relation | Silva, J. A. (2017k). Estrellas fijas / José Asunción Silva. https://catalogoenlinea.bibliotecanacional.gov.co/client/es_ES/search/asset/170472/0 | |
dc.relation | Silva, J. A. (2017l). Serenata / José Asunción Silva. https://catalogoenlinea.bibliotecanacional.gov.co/client/es_ES/search/asset/169505/0 | |
dc.relation | Silva, J. A. (2017m). Paisaje tropical / José Asunción Silva. https://catalogoenlinea.bibliotecanacional.gov.co/client/es_ES/search/asset/168908/0 | |
dc.relation | Silva, J. A. (2017n). ¡Paso! / José Asunción Silva. https://catalogoenlinea.bibliotecanacional.gov.co/client/es_ES/search/asset/172711/0 | |
dc.relation | Silva, J. A. (2017o). Triste / José Asunción Silva. https://catalogoenlinea.bibliotecanacional.gov.co/client/es_ES/search/asset/173090/0 | |
dc.relation | Silva, J. A. (2017p). Los maderos de San Juan / José Asunción Silva. https://catalogoenlinea.bibliotecanacional.gov.co/client/es_ES/search/asset/170338/0 | |
dc.relation | Silva, J. A. (2017q). Día de difuntos / José Asunción Silva. https://catalogoenlinea.bibliotecanacional.gov.co/client/es_ES/search/asset/171772/0 | |
dc.relation | Silva, J. A. (2017r). Las golondrinas / José Asunción Silva. https://catalogoenlinea.bibliotecanacional.gov.co/client/es_ES/search/asset/170472/0 | |
dc.relation | Silva, J. A. (2017s). Al oído del lector / José Asunción Silva. https://catalogoenlinea.bibliotecanacional.gov.co/client/es_ES/search/asset/170033/0 | |
dc.relation | Silva, J. A. (2017t). Zig-zags / José Asunción Silva. https://catalogoenlinea.bibliotecanacional.gov.co/client/es_ES/search/asset/174376/0 | |
dc.relation | Silva, J. A. (2017u). Muertos / José Asunción Silva. https://catalogoenlinea.bibliotecanacional.gov.co/client/es_ES/search/asset/176473/0 | |
dc.relation | Silva, J. A. (2017v). Suspiros / José Asunción Silva. https://catalogoenlinea.bibliotecanacional.gov.co/client/es_ES/search/asset/176474/0 | |
dc.relation | Silva, J. A. (2017w). Nupcial / José Asunción Silva. https://catalogoenlinea.bibliotecanacional.gov.co/client/es_ES/search/asset/173202/0 | |
dc.relation | Silva, J. A. (2017x). De Lord Tennyson / José Asunción Silva. https://catalogoenlinea.bibliotecanacional.gov.co/client/es_ES/search/asset/172435/0 | |
dc.relation | Silva, J. A. (2017y). Don Juan de Covadonga / José Asunción Silva. https://catalogoenlinea.bibliotecanacional.gov.co/client/es_ES/search/asset/171996/0 | |
dc.relation | Silva, J. A. (2017z). Media noche / José Asunción Silva. https://catalogoenlinea.bibliotecanacional.gov.co/client/es_ES/search/asset/170954/0 | |
dc.relation | Silva, J. A. (2017aa). Oratorio / José Asunción Silva. https://catalogoenlinea.bibliotecanacional.gov.co/client/es_ES/search/asset/172855/0 | |
dc.relation | Silva, J. A. (2017bb). Luz de Luna / José Asunción Silva. https://catalogoenlinea.bibliotecanacional.gov.co/client/es_ES/search/asset/171235/0 | |
dc.relation | Silva, J. A. (2017). En la tortura / José Asunción Silva. https://catalogoenlinea.bibliotecanacional.gov.co/client/es_ES/search/asset/174741/0 | |
dc.relation | Sussana, A., & Del Río, G. (2018). Enseñar edición digital con TEI en español. Aprendizaje situado y transculturación. Humanidades Digitales: Construcciones locales en contextos globales: Actas del I Congreso Internacional de la Asociación Argentina de Humanidades Digitales. https://www.aacademica.org/gimena.delrio.riande/167 | |
dc.relation | Text encoding and scholarly digital editions (Chapter 6)¿Digital Humanities in Practice. (s/f). Recuperado el 10 de junio de 2023, de https://www.cambridge.org/core/books/abs/digital-humanities-in-practice/text-encoding-and-scholarly-digital-editions/5AC5C3A56960C60B3F9450B74FED42FB | |
dc.relation | Tingiris, S., & Kinsella, B. (2021). Exploring GPT-3. Packt Publishing. https://learning.oreilly.com/library/view/exploring-gpt-3/9781800563193/B16854_01_ePub_AM.xhtml | |
dc.relation | Vaswani, A., Shazeer, N., Parmar, N., Uszkoreit, J., Jones, L., Gomez, A. N., Kaiser, L., & Polosukhin, I. (2017). Attention Is All You Need (arXiv:1706.03762). arXiv. http://arxiv.org/abs/1706.03762 | |
dc.relation | Vivek, S. (2023). When Should You Fine-Tune LLMs? https://towardsdatascience.com/when-should-you-fine-tune-llms-2dddc09a404a | |
dc.relation | Wettig, A., & Deshpande, A. (s/f). How Does ChatGPT Work? An Overview of Large Language Models (Part 1 of 3). Princeton University Media Central. Recuperado el 4 de junio de 2023, de https://mediacentral.princeton.edu/media/How+Does+ChatGPT+WorkF+An+Overview+of+Large+Language+Models+%28Part+1+of+3%29/1_d3gex17b | |
dc.relation | Williams, S. A. (s/f). ChatGPT for Coders. | |
dc.relation | Wittgenstein, L. (1996). Philosophical investigations. Blackwell | |
dc.rights | Attribution-NonCommercial-NoDerivatives 4.0 Internacional | |
dc.rights | http://creativecommons.org/licenses/by-nc-nd/4.0/ | |
dc.rights | info:eu-repo/semantics/openAccess | |
dc.rights | http://purl.org/coar/access_right/c_abf2 | |
dc.title | Automatización de marcado de texto en TEI | |
dc.type | Trabajo de grado - Maestría | |