Colombia
| Artículo de revista
Extracción Semi-automática de Información a partir de tablas HTML.
Autor
Suárez Barón, Marco Javier
Institución
Resumen
Este trabajo presenta un proceso de extracción e integración de información contenida en tablas de tipo HTML, el proceso de extracción de información se apoya en un conjunto de reglas heurísticas y una clasificación rigurosa de tablas según su tipo de estructura y complejidad.
El propósito de la investigación es generar Documentos de tipo XML para integrar la información, obtenida en el proceso de extracción.