info:eu-repo/semantics/masterThesis
Un corpus oral en idioma español con acento peruano para el reconocimiento de emociones
Autor
Delgado Mattos, Alessandra Daniela
Resumen
la comunicación, son las emociones, es por ello, que el rol de ellas ha sido ampliamente analizado en los sistemas automáticos de reconocimiento a partir del habla, los cuáles, requieren además de algoritmos robustos, corpus orales de emociones de calidad. [Motivación] Los corpus etiquetados emocionalmente son un elemento clave en la implementación de sistemas automáticos de reconocimiento de emociones a partir de habla. La carencia de los mismos hace que los hablantes de un determinado idioma, acento o dialecto, no puedan usufructuar, en toda su amplitud, de los beneficios de este desarrollo tecnológico. [Objetivos] Esta tesis tiene como objetivo diseñar y construir un corpus de emociones en español con acento peruano, de modo que pueda ser utilizado en el entrenamiento y validación de sistemas basados en Deep Learning para el reconocimiento automático de emociones. [Método] Se comenzó realizando una revisión de la literatura sobre los modelos de clasificación de emociones y los esquemas relacionados al diseño y construcción de corpus orales de emociones. Después, se definieron los criterios para diseñar un método de construcción a partir de audio-vídeos existentes en la plataforma YouTube™. Finalmente, la calidad del corpus fue evaluada de manera cualitativa y cuantitativa. [Resultados] Se construyó un corpus etiquetado con tres atributos emocionales (valencia, excitación y dominancia), con un tamaño de 7 horas 45 minutos y 52 segundos, contiene voces de un total de 80 participantes (hombres y mujeres en edad adulta) desenvolviéndose en escenarios naturales tales como debates, entrevistas y reportajes. Asimismo, se encuentra disponible de forma abierta al público en el siguiente enlace: https://zenodo.org/record/5793223#.YczDf2jMLIV [Conclusión] El corpus oral de emociones fue evaluado cualitativamente en cuanto al alcance, naturalidad, contexto y descriptores, y cuantitativamente en cuanto a su eficacia real, cumpliendo las expectativas para lo que fue construido ya que permitió el entrenamiento y validación en sistemas de reconocimiento de emociones en idioma español con acento peruano, obteniendo un buen desempeño, del 0.84 y 0.73 para las etapas de entrenamiento y validación respectivamente. Este trabajo fue financiado por el Fondo Fondo de Financiamiento: Proyecto Concytec-Banco Mundial "Mejoramiento y Ampliación de los Servicios del Sistema Nacional de Ciencia Tecnología e Innovación Tecnológica" 8682-PE, a través de su Unidad ejecutora ProCiencia. en el marco del Proyecto: KUSISQA Project: Supporting Emotions Regulation in the Teaching and Learning Processes [Numero de Contrato: 014-2019-FONDECYT-BM-INC.INV]