Objeto de conferencia
Un enfoque híbrido para la clasificación automática de obras literarias
Registro en:
issn:2451-7585
Autor
Rodríguez, Guillermo Horacio
Litman, Julián
Bolaños, Alejandro
Taboada, Gabriel Hugo
Institución
Resumen
Al contar cada vez con mayor volumen de datos a analizar y que gran parte de estos sea en formato texto, resulta muy dificultoso para las personas poder entender y aprovechar el valor que ofrecen. La clasificación automática de textos consiste en asignar a un documento de texto una serie de clases utilizando técnicas de Machine Learning basado en su contenido y los temas que lo componen. La clasifi-cación automática tiene importantes aplicaciones en la administración de contenido, la minería de opinión, el análisis de reseñas de un producto, filtros de SPAM y análisis de sentimiento en redes sociales. Este trabajo explica y detalla paso a paso una es-trategia híbrida entre aprendizaje no supervisado y clasificación automática de textos basada en obras clásicas y literatura técnica trabajando sobre textos no estructurados y seleccionando las técnicas apropiadas para llegar a una aplicación concreta. Luego de realizar evaluaciones con conjuntos de libros, los resultados obtenidos permitieron verificar que nuestro enfoque es efectivo para la asignación automática de categorías a obras literarias. Sociedad Argentina de Informática e Investigación Operativa