bachelorThesis
Sistema de generación de texto automático en dominios acotados
Autor
Bridera, Claudio Daniel
Institución
Resumen
El presente trabajo consiste en desarrollar un sistema de generación de lenguaje natural basado en templates capaz de producir avisos clasificados bien formados referidos a un producto en proceso de comercialización o de promoción. Para tal objetivo elaboramos un corpus, extrayendo de Internet avisos clasificados, el que estudiamos y analizamos utilizando diversas técnicas de procesamiento de texto. A lo largo de este trabajo describimos el desarrollo de dos algoritmos particulares implementados en Php: AdGen y su componente principal AdTagger. El primero es un sistema capaz de aprender estadísticamente representaciones de plantillas para la generación de texto, y el segundo es un etiquetador de entidades de dominio que posee una precisión del 89 % y fue elaborado en base al corpus disponible.