info:eu-repo/semantics/conferenceObject
Determinación de relevancia de palabras para procesos con dominios restringidos
Registro en:
10 º Congreso Nacional de Ingeniería Informática / Sistemas de Información (2022)
Autor
Rosenbrock, Germán
Trossero, Sebastián
Alvarez, Claudia Mabel
Heit, Fernando
Pascal, Andrés Jorge
López De Luise, María Daniela
Institución
Resumen
En este trabajo se propone un modelo basado en Minería de Textos para la determinación de relevancia que permita la extracción de palabras específicas de un
dominio (Domain-Specific Word Extraction). El alcance de la presente propuesta se remite a determinar la importancia de las palabras en el ámbito de regulaciones universitarias, en base a corpus definidos específicamente para evaluar y validar este contexto restringido. Para esto, se emplean cuatro corpus, tres de ellos de dominios relacionados con regulaciones pero aplicados a otros fueros: Regulaciones Universitarias, Regulaciones Impositivas, Regulaciones del Código Civil y un corpus genérico. Se presentan y aplican tests estadísticos pertenecientes a la minería de
textos para lenguaje español, y finalmente se comparan las palabras más relevantes del dominio de las regulaciones universitarias con un conjunto de palabras claves extraídas manualmente por especialistas, a fin de validar la propuesta. Fil: Rosenbrock, Germán. Universidad Autónoma de Entre Ríos. Facultad de Ciencia y Tecnología; Argentina. Fil: Trosero, Sebastián. Universidad Autónoma de Entre Ríos. Facultad de Ciencia y Tecnología; Argentina. Fil: Alvarez, Claudia Mabel. Universidad Autónoma de Entre Ríos. Facultad de Ciencia y Tecnología; Argentina. Fil: Heit, Fernando. Universidad Autónoma de Entre Ríos. Facultad de Ciencia y Tecnología; Argentina. Fil: Pascal, Andrés Jorge. Universidad Autónoma de Entre Ríos. Facultad de Ciencia y Tecnología; Argentina. Fil: López De Luise, María Daniela. Computational Intelligence & Information Systems Lab; Argentina. Fil: Pascal, Andrés Jorge. Universidad Tecnológica Nacional. Facultad Regional Concepción del Uruguay. Departamento Ingeniería en Sistemas de Información. Grupo de Investigación en Bases de Datos; Argentina.