Improvement of sentiment analysis in social networks using lexical analysis and user profile

dc.contributorRodríguez, Demóstenes Zegarra
dc.contributorRosa, Renata Lopes
dc.contributorLeite, Daniel Furtado
dc.contributorEsmin, Ahmed Ali Abdalla
dc.contributorCarvalho, Dárlinton Barbosa Feres
dc.creatorGuimarães, Rita Georgina
dc.date2017-09-13T18:56:43Z
dc.date2017-09-13T18:56:43Z
dc.date2017-09-11
dc.date2017-08-21
dc.date.accessioned2023-09-28T19:58:43Z
dc.date.available2023-09-28T19:58:43Z
dc.identifierGUIMARÃES, R. G. Aprimoramento da análise de sentimentos em redes sociais utilizando análise léxica e perfil de usuário. 2017. 64 p. Dissertação (Mestrado em Engenharia de Sistemas e Automação)-Universidade Federal de Lavras, Lavras, 2017.
dc.identifierrepositorio.ufla.br/jspui/handle/1/15376
dc.identifier.urihttps://repositorioslatinoamericanos.uchile.cl/handle/2250/9041537
dc.descriptionSocial networks have a large amount of data available to be exploited in an increasingly comprehensive way. Sentiment analysis uses this data to develop useful applications in people’s daily lives. However, there are still failures in this type of analysis, either by the restricted number of words contained in dictionaries or by not considering all parameters that can influence the final sentiment of a sentence such as: users profile, punctuation, geographical location or social networks using frequency, for example. More reliable results can be obtained by taking advantage of the greater number of these parameters or by grouping the most suitable parameters. First, this work suggests that the result of sentiment analysis is influenced by the adverbs punctuation, whose proposal is to reverse or intensify the final sentiment of a sentence depending of the adverbs. We work on the proposal to consider user profile characteristics such as age and gender to determine the sentiment value of each sentence posted on a social network. A Recommendation System (SR) was presented, based on the sentiment analysis of sentences extracted from social networks, from an algorithm that considers the adverbs punctuation. We also performed a detailed analysis with 7000 sentences to determine which characteristics would be more relevant, such as punctuation, number of characters, media sharing, subjects, among others; and which characteristic could be disregarded. Different machine learning algorithms were tested in search of the best result for classifying the users by age group. Through the punctuation of the sentences considering the adverbs, it was possible to obtain the absolute maximum error corresponding to 0.21, an inferior value compared to the results presented by other tools of sentiment analysis. In order to classify users by age group, the Deep Convolutional Neural Network (DCNN) had the best performance, reaching an accuracy of 0.95 in the validation tests. In addition, to validate the utility of the proposed model to classify age groups, the model was implemented in the Enhanced Sentimeter Metric (eSM), and the eSM metric results when the age group information was not available, were improved with the proposal of age group classification of this work. The advances and tests carried out show that the tools for sentiment analysis in texts extracted from social networks presented increasingly reliable and realistic results.
dc.descriptionCoordenação de Aperfeiçoamento de Pessoal do Ensino Superior (CAPES)
dc.descriptionAs redes sociais online possuem grande quantidade de dados disponíveis para serem explorados de forma cada vez mais abrangente. Através da análise de sentimentos, é possível utilizar estes dados para desenvolver aplicações úteis no cotidiano das pessoas. Porém, ainda existem falhas neste tipo de análise, seja pelo número restrito de palavras contidas nos dicionários ou por não considerarem os mais diversos parâmetros que podem influenciar no sentimento final de uma frase como: perfil dos usuários, pontuação das frases, localização geográfica ou a frequência que se utiliza as redes sociais, por exemplo. Resultados mais confiáveis podem ser obtidos aproveitando o maior número destes parâmetros ou agrupando aqueles mais adequados. Primeiramente, este trabalho sugere que o resultado da análise de sentimentos seja obtido após a pontuação dos advérbios, que tem como função inverter ou intensificar o sentimento final de uma frase. Em seguida, trabalha a proposta de considerar características do perfil do usuário, como faixa etária e gênero para determinar o valor de sentimento de cada frase postada em uma rede social. É apresentado um Sistema de Recomendação (SR), baseado na análise de sentimentos das frases extraídas das redes sociais, a partir de um algoritmo que considera a pontuação dos advérbios. Também foi realizada uma análise detalhada com 7000 frases para determinar quais características seriam mais relevantes, como o uso de pontuação, número de caracteres, compartilhamento de mídias, assuntos, entre outros; e quais poderiam ser desconsiderados. Diferentes algoritmos de aprendizagem de máquina foram testados em busca do melhor resultado para classificação de usuários por faixa etária. Através da pontuação das frases considerando os advérbios foi possível obter o erro máximo absoluto correspondente a 0.21, inferior aos resultados apresentados por outras ferramentas de análise de sentimentos. Para classificação dos usuários por faixa etária a Rede Neural Convolucional Profunda (DCNN) teve o melhor desempenho, atingindo uma precisão de 0.95 nos testes de validação. Além disso, para validar a utilidade do modelo proposto para classificar grupos etários, ele é implementado no Enhanced Sentimeter Metric (eSM), e os resultados da métrica eSM quando as informações do grupo etário não estão disponíveis, são superados com o método proposto de classificação de grupos etários por meio de aprendizagem de máquina. Os avanços e testes realizados mostram que as ferramentas de análise de sentimentos em textos extraídos das redes sociais, são capazes de apresentar resultados cada vez mais confiáveis e realistas.
dc.formatapplication/pdf
dc.languagepor
dc.publisherUniversidade Federal de Lavras
dc.publisherPrograma de Pós-Graduação em Engenharia de Sistemas e Automação
dc.publisherUFLA
dc.publisherbrasil
dc.publisherDepartamento de Engenharia
dc.rightsacesso aberto
dc.subjectMineração de dados
dc.subjectRedes sociais - Análise de sentimentos
dc.subjectAprendizagem de máquina
dc.subjectData mining
dc.subjectSocial networks - Sentiment analysis
dc.subjectMachine learning
dc.subjectBanco de Dados
dc.subjectSistemas de Informação
dc.titleAprimoramento da análise de sentimentos em redes sociais utilizando análise léxica e perfil de usuário
dc.titleImprovement of sentiment analysis in social networks using lexical analysis and user profile
dc.typedissertação


Este ítem pertenece a la siguiente institución