dc.contributorRoisenberg, Mauro
dc.contributorUniversidade Federal de Santa Catarina
dc.creatorSouza, Renato Manoel de
dc.date2020-12-08T20:59:39Z
dc.date2020-12-08T20:59:39Z
dc.date2020-11-13
dc.date.accessioned2023-09-02T07:20:53Z
dc.date.available2023-09-02T07:20:53Z
dc.identifierhttps://repositorio.ufsc.br/handle/123456789/218146
dc.identifier.urihttps://repositorioslatinoamericanos.uchile.cl/handle/2250/8582382
dc.descriptionTCC(graduação) - Universidade Federal de Santa Catarina. Centro Tecnológico. Ciências da Computação.
dc.descriptionA inteligência artificial vem demonstrando nos últimos anos resultados que podem auxiliar na solução de diversos problemas que com as tecnologias existentes ainda não são passíveis de solução. Devido esse fato, uma das áreas que podem utilizar-se da inteligência artificial é o reconhecimento de emoções através da fala, garantindo a aplicação real desses sistemas para facilitar e democratizar o acesso a esse tipo de tecnologia. O atendimento ao cliente será personalizado, com bots identificando o humor do cliente ao fazer um atendimento, podendo redirecionar para um atendimento humano caso notado um estresse na fala. Centrais de atendimento de seguradoras e serviços de emergência, principalmente, serão impactados positivamente com o reconhecimento de emoções. Este trabalho apresenta a Recurrent Neural Network(RNN)-Gated Recurrent Unit(GRU) e a Convolutional Neural Network(CNN) para classificar emoções através da fala que tiveram o melhor desempenho na etapa de experimentos. Para treinar esses modelos utilizou-se o conjunto de dados Ryerson Audio-Visual Database of Emotional Speech and Song(RAVDESS), permitindo construir um ambiente para fazer a avaliação e testes. A avaliação de um modelo treinado na língua inglesa que reconhece áudios da língua portuguesa apresentou uma precisão de aproximadamente 42%, sendo considerado insatisfatório para um classificador. As principais características que foram identificadas como responsável pelo desempenho foram, o viés da classificação sem validação, as características do conjunto de amostras e a falta do tratamento de ruído. A rede neural que apresentou a melhor precisão foi RNN-GRU com 79.69% utilizando uma técnica para aumentar o tamanho do conjunto de dados através da operação de transformação alongamento(stretch).
dc.format113 f.
dc.formatapplication/pdf
dc.languagept_BR
dc.publisherFlorianópolis, SC.
dc.rightsOpen Access
dc.subjectRedes neurais
dc.subjectReconhecimento de emoções
dc.subjectFala
dc.subjectVoz
dc.titleReconhecimento de emoções através da fala utilizando redes neurais
dc.typeTCCgrad


Este ítem pertenece a la siguiente institución