tesis de maestría
Aplicación de procesamiento de lenguaje natural sobre una encuesta de satisfacción
Fecha
2021Registro en:
10.7764/tesisUC/ING/62782
Autor
Álvarez Arismendi, Carlos
Institución
Resumen
Se emplearon técnicas de Procesamiento de Lenguaje Natural sobre una encuesta de satisfacción de la industria del retail con el objetivo de obtener información relevante del texto contestado que no se puede obtener a partir de los indicadores de nivel de satisfacción tradicionales. El trabajo se enfocó en el análisis de diferentes modelos de clasificación multi-label de texto y de resumen extractivo de texto.
Se construyó un baseline de clasificación de texto en que se utilizó FastText para modelar el lenguaje. Se expone un análisis de cómo distintos factores del preprocesamiento de texto afectan en el rendimiento de clasificación. Los resultados indican que la corrección de faltas de ortografía mejora la clasificación de los textos y el aumento artificial de datos aumenta la precisión, pero disminuye la exhaustividad. La implementacion del modelo de propósito general BERT mejora sustancialmente el rendimiento de clasificación de textos respecto del baseline. Se muestra que la corrección ortográfica es relevante en el rendimiento de clasificación y que los textos cortos se clasifican de mejor manera.
Los experimentos de resumen extractivo de texto logran resumir los hechos relevantes mejor que métodos propuestos en otros trabajos y mejor que seleccionando al azar. La incorporación de información de clasificación de texto mejora la calidad del resumen extraído.
Se comparan los resultados de la clasificación de las encuestas con los índices de satisfacción tradicionales. Se encuentra que los clientes comentan sobre más aspectos negativos que positivos y que éstos no se ven reflejados en el índice de satisfacción.