Aplicación de procesamiento de lenguaje natural sobre una encuesta de satisfacción

Álvarez Arismendi, Carlos

tesis de maestría

Fecha

2021

Registro en:

10.7764/tesisUC/ING/62782

https://doi.org/10.7764/tesisUC/ING/62782

https://repositorio.uc.cl/handle/11534/62782

Autor

Álvarez Arismendi, Carlos

Institución

Pontificia Universidad Católica de Chile

Resumen

Se emplearon técnicas de Procesamiento de Lenguaje Natural sobre una encuesta de satisfacción de la industria del retail con el objetivo de obtener información relevante del texto contestado que no se puede obtener a partir de los indicadores de nivel de satisfacción tradicionales. El trabajo se enfocó en el análisis de diferentes modelos de clasificación multi-label de texto y de resumen extractivo de texto. Se construyó un baseline de clasificación de texto en que se utilizó FastText para modelar el lenguaje. Se expone un análisis de cómo distintos factores del preprocesamiento de texto afectan en el rendimiento de clasificación. Los resultados indican que la corrección de faltas de ortografía mejora la clasificación de los textos y el aumento artificial de datos aumenta la precisión, pero disminuye la exhaustividad. La implementacion del modelo de propósito general BERT mejora sustancialmente el rendimiento de clasificación de textos respecto del baseline. Se muestra que la corrección ortográfica es relevante en el rendimiento de clasificación y que los textos cortos se clasifican de mejor manera. Los experimentos de resumen extractivo de texto logran resumir los hechos relevantes mejor que métodos propuestos en otros trabajos y mejor que seleccionando al azar. La incorporación de información de clasificación de texto mejora la calidad del resumen extraído. Se comparan los resultados de la clasificación de las encuestas con los índices de satisfacción tradicionales. Se encuentra que los clientes comentan sobre más aspectos negativos que positivos y que éstos no se ven reflejados en el índice de satisfacción.

Materias

Mostrar el registro completo del ítem