Dissertação
Análise do sinal de fala para reconhecimento de emoções utilizando representação semântica
Speech signal analysis for emotion recognition using semantic representation
Registro en:
SILVA, Victor Gabriell Ribeiro da. Análise do sinal de fala para reconhecimento de emoções utilizando representação semântica. 2022. 94 f. Dissertação (Mestrado em Engenharia Elétrica) - Universidade Federal de Sergipe, São Cristóvão, 2022.
Autor
Silva, Victor Gabriell Ribeiro da
Institución
Resumen
The interest in automatically analyzing human emotions has grown in recent years,
mainly due to its possible applications in society. Over the last 20 years, several works were
proposed in order to extract features in speech signals capable of representing emotions.
Most works use features associated to prosody and the spectrum of the speech signal. In
this work, speech analysis methodologies are presented, exploring mainly pre-processing,
feature extraction and classification techniques. Furthermore, a methodology based on
semantic representation is used in order to obtain a non-linear mapping of the feature space.
Then, it is possible to use the semantic representation to add complementary information
and, consequently, increase the discrimination between the classes. The results obtained
show that semantic representation is able to significantly increase the accuracy in the task
of speech emotion recognition. Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES O interesse em analisar automaticamente as emoções humanas tem crescido nos
últimos anos, principalmente devido as suas possíveis aplicações na sociedade. Ao longo
dos últimos 20 anos, diversos trabalhos foram propostos a fim de determinar características
nos sinais de voz capazes de representar as emoções. A maior parte dos trabalhos utiliza
atributos associados à prosódia e ao espectro do sinal de voz. Neste trabalho, são apresentadas metodologias de análise do sinal de voz, explorando principalmente as técnicas
de pré-processamento, extração de características e classificação. Além disso, é utilizada
uma metodologia baseada na representação semântica, a fim de obter um mapeamento
não-linear do espaço de características que seja útil para acrescentar informações complementares, consequentemente, aumentando a discriminação entre as classes. Os resultados
obtidos apontam que, quando ajustada adequadamente, a representação semântica é capaz
de aumentar significativamente a acurácia da classificação de emoções expressadas em
sinais de voz. São Cristóvão