Estudio de la metodología de plantillas para tareas generadoras del lenguaje humano - GPT3

Yager Velarde, Frank Ray; Arteaga Burgos, Anthony Alexander

bachelorThesis

Fecha

2023-03

Registro en:

http://repositorio.ug.edu.ec/handle/redug/68826

https://repositorioslatinoamericanos.uchile.cl/handle/2250/8265726

Autor

Yager Velarde, Frank Ray

Arteaga Burgos, Anthony Alexander

Institución

Universidad de Guayaquil (Ecuador)

Resumen

La presente investigación tiene como objetivo el evaluar la precisión del modelo pre-entrenado GPT-3 en la identificación del nivel de dificultad de las palabras en Ingles, también se pretende comparar los resultados obtenidos con los resultados que se obtuvieron en la competencia “SemEval-2021 Task 1: Lexical Complexity Prediction”. Para evaluar el modelo se hará uso de un corpus denominado CompLex donde se asignarán el nivel de dificultad de cada palabra a partir de su complejidad, para esta clasificación se aplicará la escala Likert. El siguiente paso es valorar cada palabra del corpus según el nivel de dificultad que considere el modelo, luego se aplicará distintos métodos para transformar ese nivel de dificultad en valores numéricos (Este valor número será conocido como la complejidad GPT-3) con el fin de aplicar métricas donde se podrá conocer que tan preciso es este y como paso final se hará una comparación entre los resultados de GPT-3 y los modelos presentados en la competencia del SemEval-2021.

The objective of this research is to evaluate the accuracy of the pre-trained GPT-3 model in identifying the level of difficulty of English words, as well as to compare the results obtained with those of the "SemEval-2021 Task 1: Lexical Complexity Prediction" competition. To evaluate the model, a corpus called CompLex will be used, where the difficulty level of each word will be assigned based on its complexity, using the Likert scale. The next step is to evaluate each word in the corpus according to the level of difficulty determined by the model, and then apply different methods to transform this level of difficulty into numerical values (this numerical value will be known as GPT-3 complexity), in order to apply metrics that will reveal how accurate it is. Finally, a comparison will be made between the results of GPT-3 and the models presented in the SemEval-2021 competition.

Materias

GPT-3

MODELOS TRANSFORMERS

PROCESAMIENTO DEL LENGUAJE NATURAL

CompLex

NLP

MACHINE LEARNING

SemEval-2021

TRANSFORMER MODELS

NATURAL LANGUAGE PROCESSING

Mostrar el registro completo del ítem