Trabalho de Conclusão de Curso
Avaliação experimental de classificadores para análise de sentimentos em dados de redes sociais
Registro en:
TIBURCIO, Gabriel Valentin. Avaliação Experimental de Classificadores para Análise de Sentimentos em Dados de Redes Sociais. 2021. 61 f. Trabalho de Conclusão de Curso (Graduação em Estatística) – Universidade Federal de Uberlândia, Uberlândia, 2021.
Autor
Tiburcio, Gabriel Valentin
Institución
Resumen
Pesquisa sem auxílio de agências de fomento Trabalho de Conclusão de Curso (Graduação) As redes sociais virtuais são ambientes cada vez mais comuns no cotidiano das pessoas
em todo o mundo. Os usuários das redes sociais compartilham informações sobre sua
vida constantemente para outras pessoas, tornando as redes sociais em uma possível
fonte de informação sobre as emoções de um indivíduo. O Twitter faz parte das redes
sociais mais populares e utilizadas no mundo, onde seus usuários compartilham tweets,
que são textos curtos de até 280 caracteres, e também imagens e vídeos. Por ser uma
rede social tão utilizada e por disponibilizar um grande volume de tweets gratuitamente,
diferentes estudos sobre análise de sentimentos são realizados utilizando esses dados. A
análise de sentimentos combina conceitos de aprendizagem de máquina, recuperação de
informação e linguística computacional para extrair informações sobre opiniões e emoções
contidas em diversas fontes de dados, e então realizar uma classificação automática para
um sentimento. Neste trabalho de conclusão de curso, são abordadas técnicas de préprocessamento de texto e cinco algoritmos para classificação de sentimento encontrados
na literatura, sendo eles Random Forest, Logistic Regression, Naive Bayes Classifier, KNearest Neighbor (KNN) e Support Vector Machine (SVM). Neste contexto, foram feitos
experimentos e comparações de desempenho entre os algoritmos utilizando uma base de
dados pública. Foram feitas análises dos resultados das predições, com o objetivo de definir
o classificador que melhor realizou a tarefa de classificação de sentimento. Os resultados
mostram os algoritmos SVM e Logistic Regression se sobressaindo sobre os demais em
todos os experimentos, obtendo 77% e 76, 1% de acurácia respectivamente. Já o algoritmo
KNN com os piores resultados de classificações de sentimento com no máximo 59, 6% de
acurácia.