dc.contributorVaughan Caro, Nicolás
dc.contributorRoa Garcés, Nathalia
dc.contributorMartínez Peñaloza, Germán Camilo
dc.creatorRivera Parra, Álvaro Andrés
dc.date.accessioned2023-08-29T12:54:59Z
dc.date.accessioned2023-09-06T23:54:39Z
dc.date.available2023-08-29T12:54:59Z
dc.date.available2023-09-06T23:54:39Z
dc.date.created2023-08-29T12:54:59Z
dc.date.issued2023-08-28
dc.identifierhttp://hdl.handle.net/1992/70089
dc.identifierinstname:Universidad de los Andes
dc.identifierreponame:Repositorio Institucional Séneca
dc.identifierrepourl:https://repositorio.uniandes.edu.co/
dc.identifier.urihttps://repositorioslatinoamericanos.uchile.cl/handle/2250/8726951
dc.description.abstractEste trabajo de grado describe la creación de un programa que automatiza la codificación de texto plano a la guía y estándar TEI, a través de peticiones al transformador generativo preentrenado de ChatGPT, mediante su API. En el campo de las humanidades digitales, la digitalización de textos conlleva un proceso de codificación y marcado de texto, que es hecho usualmente de forma manual o con ayuda de editores de texto pagos, lo que conlleva una alta inversión de tiempo, dinero y trabajo. Las directrices TEI son usadas en preservación digital, creación de bases de datos y mejora de búsquedas, colecciones digitales, corpus lingüísticos y libros electrónicos, entre otros. La interfaz de usuario gráfica (GUI) del programa fue hecha con el lenguaje de programación Python, con la librería Tkinter, al igual que el código para realizar las peticiones (prompts) de marcado al, mediante la API de OpenAI.
dc.languagespa
dc.publisherUniversidad de los Andes
dc.publisherMaestría en Humanidades Digitales
dc.publisherFacultad de Artes y Humanidades
dc.publisherCentro de Estudios en Periodismo ¿ Ceper
dc.relationAlammar, J. (s/f). The Illustrated GPT-2 (Visualizing Transformer Language Models). Recuperado el 4 de junio de 2023, de http://jalammar.github.io/illustrated-gpt2/
dc.relationHamidovi¿, D., Clivaz, C., & Savant, S. B. (s/f). Using Natural Language Processing to Search for Textual References Title: Ancient Manuscripts in Digital Culture Book Subtitle: Visualisation, Data Mining, Communication. https://doi.org/10.1163/j.ctvrxk44t.11
dc.relationBang, Y., Cahyawijaya, S., Lee, N., Dai, W., Su, D., Wilie, B., Lovenia, H., Ji, Z., Yu, T., Chung, W., Do, Q. V., Xu, Y., & Fung, P. (2023). A Multitask, Multilingual, Multimodal Evaluation of ChatGPT on Reasoning, Hallucination, and Interactivity (arXiv:2302.04023). arXiv. http://arxiv.org/abs/2302.04023
dc.relationBowers, J., & Romary, L. (2018). Bridging the Gaps between Digital Humanities, Lexicography, and Linguistics: A TEI Dictionary for the Documentation of Mixtepec-Mixtec. Dictionaries: Journal of the Dictionary Society of North America, 39(2), 79¿106. https://doi.org/10.1353/dic.2018.0022
dc.relationBurnard, L. (2022). ¿Qué es la Iniciativa de Codificación de Textos?: Cómo añadir marcado inteligente a los recursos digitales (N. Vaughan, Trad.). Open Edition Press. https://doi.org/10.4000/books.oep.15662
dc.relationDel Río, G. (2019, diciembre 6). Humanidades Digitales, infraestructuras visibles e invisibles. Humanidades Digitales, infraestructuras visibles e invisibles. https://hdlabconicet.github.io/HD-infraestructuras/
dc.relationDon, Z. M., & Knowles, G. (2021). The digital humanities and re-imagined language description: A linguistic model of Malay with potential for other languages. Digital Scholarship in the Humanities. https://doi.org/10.1093/llc/fqab101
dc.relationGeewax, J. J., & Skeet, J. (2021). API design patterns. Manning.
dc.relationHammond, M. (2020). Python for Linguists. Cambridge University Press; Cambridge Core. https://doi.org/10.1017/9781108642408
dc.relationDeepLearningAI. (2023, mayo 17). Google Goes All-In on AI, Do You Share GPT-3s Politics?, and more. Google Goes All-In on AI, Do You Share GPT-3s Politics?, And More. https://www.deeplearning.ai/the-batch/issue-197/
dc.relationIde, N., & Pustejovsky, J. (Eds.). (2017). Handbook of Linguistic Annotation. Springer Netherlands. https://doi.org/10.1007/978-94-024-0881-2
dc.relationJensen, K. E. (2014). Linguistics and the digital humanities: SMID, 57, 20.
dc.relationKrohn, J., Beyleveld, G., & Bassens, A. (2020). Deep learning illustrated: A visual, interactive guide to artificial intelligence (1st edition). Addison-Wesley.
dc.relationLi, H. (2019). Research Methods for the Digital Humanities. Lewis Levenberg, Tai Neilson and David Rheams (eds.). Digital Scholarship in the Humanities, 34(3), 699-701. https://doi.org/10.1093/llc/fqz049
dc.relationLoukides, M. (2023). What Are ChatGPT and Its Friends? O'Reilly Media, Inc. https://learning.oreilly.com/library/view/what-are-chatgpt/9781098152604/ch01.html
dc.relationManning, C. D., & Schiitze, H. (s/f). Foundations of Statistical Natural Language Processing.
dc.relationMcShane, M., & Nirenburg, S. (2021a). Linguistics for the Age of AI. En Linguistics for the Age of AI. The MIT Press. https://doi.org/10.7551/mitpress/13618.001.0001
dc.relationMehl, S. (2021). Why Linguists Should Care about Digital Humanities (and Epidemiology). Journal of English Linguistics, 49(3), 331-337. https://doi.org/10.1177/00754242211019072
dc.relationMylonas, E., & Renear, A. (1999). The Text Encoding Initiative at 10: Not Just an Interchange Format Anymore ¿ But a New Research Community. Computers and the Humanities, 33(1), 1-9. https://doi.org/10.1023/A:1001832310939
dc.relationOpenAI Cookbook. (2023). [Jupyter Notebook]. OpenAI. https://github.com/openai/openai-cookbook (Obra original publicada en 2022)
dc.relationOuyang, L., Wu, J., Jiang, X., Almeida, D., Wainwright, C. L., Mishkin, P., Zhang, C., Agarwal, S., Slama, K., Ray, A., Schulman, J., Hilton, J., Kelton, F., Miller, L., Simens, M., Askell, A., Welinder, P., Christiano, P., Leike, J., & Lowe, R. (2022). Training language models to follow instructions with human feedback (arXiv:2203.02155). arXiv. http://arxiv.org/abs/2203.02155
dc.relationOzdemir, S. (2023). Quick Start Guide to Large Language Models: Strategies and Best Practices for Using ChatGPT and Other LLMs. Pearson Education (US). https://books.google.com.co/books?id=U6HWzwEACAAJ
dc.relationOpen AI. (2023). Pricing. Recuperado el 15 de junio de 2023, de https://openai.com/pricing#language-models
dc.relationRedHat (2023). ¿Qué es la automatización? Ventajas e importancia de automatizar. (s/f). Recuperado el 9 de junio de 2023, de https://www.redhat.com/es/topics/automation
dc.relationRoy, N., & Forget, B. (2019). MIT Schwarzman College of Computing Task Force Working Group on Computing Infrastructure Final Report. http://web.mit.edu/comptfreport/infrastructure.pdf
dc.relationSanh, V., Webson, A., Raffel, C., Bach, S. H., Sutawika, L., Alyafeai, Z., Chaffin, A., Stiegler, A., Scao, T. L., Raja, A., Dey, M., Bari, M. S., Xu, C., Thakker, U., Sharma, S. S., Szczechla, E., Kim, T., Chhablani, G., Nayak, N., Rush, A. M. (2022). Multitask Prompted Training Enables Zero-Shot Task Generalization (arXiv:2110.08207). arXiv. http://arxiv.org/abs/2110.08207
dc.relationShen, Y., Song, K., Tan, X., Li, D., Lu, W., & Zhuang, Y. (2023). HuggingGPT: Solving AI Tasks with ChatGPT and its Friends in Hugging Face.
dc.relationSperberg-McQueen, C. M. Text in the Electronic Age: Texual Study and Textual Study and Text Encoding, with Examples from Medieval Texts, Literary and Linguistic Computing, Volumen 6, Número 1, 1991, pp. 34-46, https://doi.org/10.1093/llc/6.1.34
dc.relationSilva, J. A. /2017a). A un pesimista / José Asunción Silva. https://catalogoenlinea.bibliotecanacional.gov.co/client/es_ES/search/asset/173608/0
dc.relationSilva, J. A. /2017b). Nocturno / José Asunción Silva. https://catalogoenlinea.bibliotecanacional.gov.co/client/es_ES/search/asset/169473/0
dc.relationSilva, J. A. /2017c). Nidos / José Asunción Silva. https://catalogoenlinea.bibliotecanacional.gov.co/client/es_ES/search/asset/169436/0
dc.relationSilva, J. A. /2017d). Estrofas / José Asunción Silva. https://catalogoenlinea.bibliotecanacional.gov.co/client/es_ES/search/asset/169505/0
dc.relationSilva, J. A. /2017e). Nocturno III /José Asunción Silva. https://catalogoenlinea.bibliotecanacional.gov.co/client/es_ES/search/asset/169473/0
dc.relationSilva, J. A. (2017f). Psicopatía /José Asunción Silva. https://catalogoenlinea.bibliotecanacional.gov.co/client/es_ES/search/asset/169700/0
dc.relationSilva, J. A. (2017g). Vejeces / José Asunción Silva. https://catalogoenlinea.bibliotecanacional.gov.co/client/es_ES/search/asset/174203/0
dc.relationSilva, J. A. (2017h). Las crisálidas / José Asunción Silva. https://catalogoenlinea.bibliotecanacional.gov.co/client/es_ES/search/asset/169756/0
dc.relationSilva, J. A. (2017i). Primera comunión / José Asunción Silva. https://catalogoenlinea.bibliotecanacional.gov.co/client/es_ES/search/asset/169241/0
dc.relationSilva, J. A. (2017j). Sus dos mesas / José Asunción Silva. https://catalogoenlinea.bibliotecanacional.gov.co/client/es_ES/search/asset/170888/0
dc.relationSilva, J. A. (2017k). Estrellas fijas / José Asunción Silva. https://catalogoenlinea.bibliotecanacional.gov.co/client/es_ES/search/asset/170472/0
dc.relationSilva, J. A. (2017l). Serenata / José Asunción Silva. https://catalogoenlinea.bibliotecanacional.gov.co/client/es_ES/search/asset/169505/0
dc.relationSilva, J. A. (2017m). Paisaje tropical / José Asunción Silva. https://catalogoenlinea.bibliotecanacional.gov.co/client/es_ES/search/asset/168908/0
dc.relationSilva, J. A. (2017n). ¡Paso! / José Asunción Silva. https://catalogoenlinea.bibliotecanacional.gov.co/client/es_ES/search/asset/172711/0
dc.relationSilva, J. A. (2017o). Triste / José Asunción Silva. https://catalogoenlinea.bibliotecanacional.gov.co/client/es_ES/search/asset/173090/0
dc.relationSilva, J. A. (2017p). Los maderos de San Juan / José Asunción Silva. https://catalogoenlinea.bibliotecanacional.gov.co/client/es_ES/search/asset/170338/0
dc.relationSilva, J. A. (2017q). Día de difuntos / José Asunción Silva. https://catalogoenlinea.bibliotecanacional.gov.co/client/es_ES/search/asset/171772/0
dc.relationSilva, J. A. (2017r). Las golondrinas / José Asunción Silva. https://catalogoenlinea.bibliotecanacional.gov.co/client/es_ES/search/asset/170472/0
dc.relationSilva, J. A. (2017s). Al oído del lector / José Asunción Silva. https://catalogoenlinea.bibliotecanacional.gov.co/client/es_ES/search/asset/170033/0
dc.relationSilva, J. A. (2017t). Zig-zags / José Asunción Silva. https://catalogoenlinea.bibliotecanacional.gov.co/client/es_ES/search/asset/174376/0
dc.relationSilva, J. A. (2017u). Muertos / José Asunción Silva. https://catalogoenlinea.bibliotecanacional.gov.co/client/es_ES/search/asset/176473/0
dc.relationSilva, J. A. (2017v). Suspiros / José Asunción Silva. https://catalogoenlinea.bibliotecanacional.gov.co/client/es_ES/search/asset/176474/0
dc.relationSilva, J. A. (2017w). Nupcial / José Asunción Silva. https://catalogoenlinea.bibliotecanacional.gov.co/client/es_ES/search/asset/173202/0
dc.relationSilva, J. A. (2017x). De Lord Tennyson / José Asunción Silva. https://catalogoenlinea.bibliotecanacional.gov.co/client/es_ES/search/asset/172435/0
dc.relationSilva, J. A. (2017y). Don Juan de Covadonga / José Asunción Silva. https://catalogoenlinea.bibliotecanacional.gov.co/client/es_ES/search/asset/171996/0
dc.relationSilva, J. A. (2017z). Media noche / José Asunción Silva. https://catalogoenlinea.bibliotecanacional.gov.co/client/es_ES/search/asset/170954/0
dc.relationSilva, J. A. (2017aa). Oratorio / José Asunción Silva. https://catalogoenlinea.bibliotecanacional.gov.co/client/es_ES/search/asset/172855/0
dc.relationSilva, J. A. (2017bb). Luz de Luna / José Asunción Silva. https://catalogoenlinea.bibliotecanacional.gov.co/client/es_ES/search/asset/171235/0
dc.relationSilva, J. A. (2017). En la tortura / José Asunción Silva. https://catalogoenlinea.bibliotecanacional.gov.co/client/es_ES/search/asset/174741/0
dc.relationSussana, A., & Del Río, G. (2018). Enseñar edición digital con TEI en español. Aprendizaje situado y transculturación. Humanidades Digitales: Construcciones locales en contextos globales: Actas del I Congreso Internacional de la Asociación Argentina de Humanidades Digitales. https://www.aacademica.org/gimena.delrio.riande/167
dc.relationText encoding and scholarly digital editions (Chapter 6)¿Digital Humanities in Practice. (s/f). Recuperado el 10 de junio de 2023, de https://www.cambridge.org/core/books/abs/digital-humanities-in-practice/text-encoding-and-scholarly-digital-editions/5AC5C3A56960C60B3F9450B74FED42FB
dc.relationTingiris, S., & Kinsella, B. (2021). Exploring GPT-3. Packt Publishing. https://learning.oreilly.com/library/view/exploring-gpt-3/9781800563193/B16854_01_ePub_AM.xhtml
dc.relationVaswani, A., Shazeer, N., Parmar, N., Uszkoreit, J., Jones, L., Gomez, A. N., Kaiser, L., & Polosukhin, I. (2017). Attention Is All You Need (arXiv:1706.03762). arXiv. http://arxiv.org/abs/1706.03762
dc.relationVivek, S. (2023). When Should You Fine-Tune LLMs? https://towardsdatascience.com/when-should-you-fine-tune-llms-2dddc09a404a
dc.relationWettig, A., & Deshpande, A. (s/f). How Does ChatGPT Work? An Overview of Large Language Models (Part 1 of 3). Princeton University Media Central. Recuperado el 4 de junio de 2023, de https://mediacentral.princeton.edu/media/How+Does+ChatGPT+WorkF+An+Overview+of+Large+Language+Models+%28Part+1+of+3%29/1_d3gex17b
dc.relationWilliams, S. A. (s/f). ChatGPT for Coders.
dc.relationWittgenstein, L. (1996). Philosophical investigations. Blackwell
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 Internacional
dc.rightshttp://creativecommons.org/licenses/by-nc-nd/4.0/
dc.rightsinfo:eu-repo/semantics/openAccess
dc.rightshttp://purl.org/coar/access_right/c_abf2
dc.titleAutomatización de marcado de texto en TEI
dc.typeTrabajo de grado - Maestría


Este ítem pertenece a la siguiente institución