article
Diseño de una solución IT para el análisis de sentimientos frente a la opinión de las figuras públicas usando técnicas de web scraping y la Twitter API.
Design of an IT solution for sentiment analysis against the opinion of public figures using web scraping techniques and the Twitter API.
Autor
Álvarez Correa Mercado, Ricardo
Rodríguez González, Jose
Institución
Resumen
Colombia es un país que vive dentro del constante debate político, siendo Twitter la plataforma por excelencia para compartir opiniones de este tipo. Nos encontramos con que en estas opiniones dejan una cantidad gigante de información que no está organizada ni centralizada, haciendo que para el ciudadano común sea difícil interpretarla. Gracias a las funcionalidades que ofrece la Twitter API y valiéndonos de técnicas de Machine Learning para el análisis de datos, hemos creado una solución IT capaz de tomar las distintas opiniones sobre las figuras políticas del país y clasificarlas según los sentimientos asociados a ellas. Nuestro prototipo cuenta con una base de datos en PostgreSQL y con un modelo de análisis de datos desarrollado en Python, usando como base para la red neuronal la librería Keras. Luego de las debidas fases de entrenamiento y prueba nuestro modelo tuvo un porcentaje de precisión del 85% en la clasificación de tweets en base a sus sentimientos. Consideramos que, a modo de desarrollo futuro, nuestra solución abre muchas posibilidades como la ampliación hacia otras redes sociales usando técnicas de Web Scraping o la opción de desarrollos web y móvil para la retransmisión de los análisis generados hacia el público general. Colombia is a country that lives within the constant political debate, being Twitter the platform par excellence to share opinions of this type. We find that these opinions leave a huge amount of information that is not organized or centralized, making it difficult for the common citizen to interpret it. Thanks to the features offered by the Twitter API and using Machine Learning techniques for data analysis, we have created an IT solution capable of taking the different opinions about the country's political figures and classifying them according to the feelings associated with them. Our prototype has a PostgreSQL database and a data analysis model developed in Python, using the Keras library as the basis for the neural network. After the proper training and testing phases, our model had an accuracy rate of 85% in classifying tweets based on their sentiments. We consider that, by way of future development, our solution opens up many possibilities such as the extension to other social networks using Web Scraping techniques or the option of web and mobile development for the retransmission of the analysis generated to the general public.