dissertação
Aprimoramento da análise de sentimentos em redes sociais utilizando análise léxica e perfil de usuário
Improvement of sentiment analysis in social networks using lexical analysis and user profile
Registro en:
GUIMARÃES, R. G. Aprimoramento da análise de sentimentos em redes sociais utilizando análise léxica e perfil de usuário. 2017. 64 p. Dissertação (Mestrado em Engenharia de Sistemas e Automação)-Universidade Federal de Lavras, Lavras, 2017.
repositorio.ufla.br/jspui/handle/1/15376
Autor
Guimarães, Rita Georgina
Institución
Resumen
Social networks have a large amount of data available to be exploited in an increasingly comprehensive
way. Sentiment analysis uses this data to develop useful applications in people’s
daily lives. However, there are still failures in this type of analysis, either by the restricted number
of words contained in dictionaries or by not considering all parameters that can influence
the final sentiment of a sentence such as: users profile, punctuation, geographical location or
social networks using frequency, for example. More reliable results can be obtained by taking
advantage of the greater number of these parameters or by grouping the most suitable parameters.
First, this work suggests that the result of sentiment analysis is influenced by the adverbs
punctuation, whose proposal is to reverse or intensify the final sentiment of a sentence depending
of the adverbs. We work on the proposal to consider user profile characteristics such as
age and gender to determine the sentiment value of each sentence posted on a social network.
A Recommendation System (SR) was presented, based on the sentiment analysis of sentences
extracted from social networks, from an algorithm that considers the adverbs punctuation.
We also performed a detailed analysis with 7000 sentences to determine which characteristics
would be more relevant, such as punctuation, number of characters, media sharing, subjects,
among others; and which characteristic could be disregarded. Different machine learning algorithms
were tested in search of the best result for classifying the users by age group. Through
the punctuation of the sentences considering the adverbs, it was possible to obtain the absolute
maximum error corresponding to 0.21, an inferior value compared to the results presented by
other tools of sentiment analysis. In order to classify users by age group, the Deep Convolutional
Neural Network (DCNN) had the best performance, reaching an accuracy of 0.95 in the
validation tests. In addition, to validate the utility of the proposed model to classify age groups,
the model was implemented in the Enhanced Sentimeter Metric (eSM), and the eSM metric
results when the age group information was not available, were improved with the proposal of
age group classification of this work. The advances and tests carried out show that the tools for
sentiment analysis in texts extracted from social networks presented increasingly reliable and
realistic results. Coordenação de Aperfeiçoamento de Pessoal do Ensino Superior (CAPES) As redes sociais online possuem grande quantidade de dados disponíveis para serem explorados
de forma cada vez mais abrangente. Através da análise de sentimentos, é possível utilizar estes
dados para desenvolver aplicações úteis no cotidiano das pessoas. Porém, ainda existem falhas
neste tipo de análise, seja pelo número restrito de palavras contidas nos dicionários ou por não
considerarem os mais diversos parâmetros que podem influenciar no sentimento final de uma
frase como: perfil dos usuários, pontuação das frases, localização geográfica ou a frequência
que se utiliza as redes sociais, por exemplo. Resultados mais confiáveis podem ser obtidos
aproveitando o maior número destes parâmetros ou agrupando aqueles mais adequados. Primeiramente,
este trabalho sugere que o resultado da análise de sentimentos seja obtido após a
pontuação dos advérbios, que tem como função inverter ou intensificar o sentimento final de
uma frase. Em seguida, trabalha a proposta de considerar características do perfil do usuário,
como faixa etária e gênero para determinar o valor de sentimento de cada frase postada em uma
rede social. É apresentado um Sistema de Recomendação (SR), baseado na análise de sentimentos
das frases extraídas das redes sociais, a partir de um algoritmo que considera a pontuação
dos advérbios. Também foi realizada uma análise detalhada com 7000 frases para determinar
quais características seriam mais relevantes, como o uso de pontuação, número de caracteres,
compartilhamento de mídias, assuntos, entre outros; e quais poderiam ser desconsiderados. Diferentes
algoritmos de aprendizagem de máquina foram testados em busca do melhor resultado
para classificação de usuários por faixa etária. Através da pontuação das frases considerando
os advérbios foi possível obter o erro máximo absoluto correspondente a 0.21, inferior aos resultados
apresentados por outras ferramentas de análise de sentimentos. Para classificação dos
usuários por faixa etária a Rede Neural Convolucional Profunda (DCNN) teve o melhor desempenho,
atingindo uma precisão de 0.95 nos testes de validação. Além disso, para validar
a utilidade do modelo proposto para classificar grupos etários, ele é implementado no Enhanced
Sentimeter Metric (eSM), e os resultados da métrica eSM quando as informações do grupo
etário não estão disponíveis, são superados com o método proposto de classificação de grupos
etários por meio de aprendizagem de máquina. Os avanços e testes realizados mostram que
as ferramentas de análise de sentimentos em textos extraídos das redes sociais, são capazes de
apresentar resultados cada vez mais confiáveis e realistas.