info:eu-repo/semantics/article
Creation of a Corpus of Opinions with Emotions Using Machine Learning
Creación de un Corpus de Opiniones con Emociones Usando Aprendizaje Automático;
Criando um corpus de opiniões com emoções usando o Machine Learning
Registro en:
10.33414/rtyc.37.11-23.2020
Autor
Cardoso, Alejandra Carolina
Talamé, María Lorena
Amor, Matías Nicolás
Monge, Agustina
Institución
Resumen
The identification of feelings expressed in textual opinions can be understood as the categorization of them according to their characteristics, and is of great interest today. Supervised learning is one of the most popular methods for textual classification, but a lot of labeled data is needed for training. Semi-supervised learning overcomes this limitation, as it involves working with a small set of labeled data and a larger unlabeled data set. A text classification method was developed that combines both types of learning. Short texts or opinions from the social network Twitter were compiled, to which a series of cleaning and preparation actions were applied, and then classified into four feelings: anger, disgust, sadness and happiness. The precision and recall obtained with the method were satisfactory and as a result, a corpus of messages categorized according to the expressed feeling was obtained. La identificación de los sentimientos expresados en opiniones textuales puede entenderse como la categorización de los mismos según sus características, y resulta de gran interés en la actualidad. El aprendizaje supervisado es uno de los métodos más populares para la clasificación textual, pero se necesitan muchos datos etiquetados para el entrenamiento. El aprendizaje semi supervisado supera esta limitación, ya que implica trabajar con un pequeño conjunto de datos etiquetados y otro mayor sin etiquetar. Se desarrolló un método de clasificación de textos que combina ambos tipos de aprendizajes. Se recopilaron textos breves u opiniones de la red social Twitter, a los que se aplicaron una serie de acciones de limpieza y preparación, para luego clasificarlos en cuatro sentimientos: ira, asco, tristeza y felicidad. La precisión y recall obtenidos con el método fueron satisfactorios y como consecuencia, se logró obtener un corpus de mensajes categorizados según el sentimiento expresado. A identificação dos sentimentos expressos nas opiniões textuais pode ser entendida como a categorização deles de acordo com suas características, e é de grande interesse hoje. O aprendizado supervisionado é um dos métodos mais populares de classificação textual, mas muitos dados marcados são necessários para o treinamento. O aprendizado semi-supervisionado supera essa limitação, pois envolve trabalhar com um pequeno conjunto de dados marcados e um conjunto maior de dados não marcados. Foi desenvolvido um método de classificação de texto que combina os dois tipos de aprendizado. Foram coletados textos curtos ou opiniões da rede social Twitter, aos quais foram aplicadas uma série de ações de limpeza e preparação, e depois classificadas em quatro sentimentos: raiva, nojo, tristeza e felicidade. A precisão e o recall obtidos com o método foram satisfatórios e, como conseqüência, foi alcançado um corpus de mensagens categorizadas de acordo com o sentimento.