Objeto de conferencia
Métodos iconográficos de observación, exploración y comunicación aplicados a la minería de textos
Registro en:
Autor
Cesari, M.
Rodríguez, Darío
Rancan, Claudio
Merlino, Hernán
Britos, Paola Verónica
García Martínez, Ramón
Institución
Resumen
La lingüística computacional es la ciencia que trata de la aplicación de los métodos computacionales en el estudio del lenguaje natural (Gelbukh and Bolshakov, 1999). El objetivo más importante es la comprensión del lenguaje, es decir, la transformación del lenguaje hablado o escrito a una representación formal del conocimiento, como por ejemplo una red semántica.
Algunas de estas otras áreas de investigación son procesamiento de voz, generación de texto y procesamiento de texto.
El procesamiento automático de textos es una de las áreas mas importantes dentro de esta area. El mismo considera una gran diversidad de tareas, como la separación de palabras, y tareas de minería de texto (categorización, clasificación de textos, clustering, descubrimiento de patrones, tendencias, desviaciones, etc.).
La minería de texto es la más reciente área de investigación del procesamiento de textos. Ella se define como el proceso de descubrimiento de patrones interesantes y nuevos conocimientos en una compilación de textos, es decir, la minería de texto es el proceso encargado del descubrimiento de conocimientos que no existían explícitamente en ningún documento textual, pero que surgen de relacionar el contenido de varios de ellos (Hearst, 1999; Kodratoff, 1999). Tiene como objetivo principal la búsqueda de conocimiento útil en enormes colecciones de documentos estructurados y no-estructurados (e-mails, actas, libros, artículos, discursos, encuestas, etc.). Los problemas a abordar pueden surgir del estudio de textos (comparación de estilos, atribución de autor, búsqueda documental, etc.) o ser de naturaleza no textual, pero cuyo tratamiento lleve a considerar ciertos textos como datos portadores de información (será el caso en psicología y sociología con las entrevistas en profundidad y tests, en politología con los discursos, programas políticos y artículos periodísticos, etc.). Entre los textos se encuentran las opiniones de respuestas abiertas de encuestas.
El tratamiento de estos tipos de texto, se enriquece con la información complementaria obtenida con las respuestas al cuestionario estructurado. Una de las herramientas de la minería de texto es el “Cartografiado de Texto”, que nos permite extraer unidades en los textos, enriquecer la lexicometría con los métodos de análisis multivariado y aplicar las herramientas de visualización a las tablas léxicas o volúmenes de datos lingüísticos. Estas herramientas de visualización involucran técnicas estadísticas de análisis léxico, técnicas estadísticas de exploración multivariada y técnicas de Inteligencia Artificial como mapas autoorganizados de Kohonen. Eje: Ingeniería de Software y Base de Datos Red de Universidades con Carreras en Informática