Objeto de conferencia
Modelo de extracción automática de información a partir de tablas HTML
Registro en:
Autor
Suarez Baron, Marco Javier
Institución
Resumen
Este trabajo presenta un modelo de extracción e integración de información contenida dentro de tablas de tipo HTML, el modelo de extracción de información se apoya en un conjunto de heurísticas y reglas de deducción. Para determinar este conjunto de reglas se determino una detección rigurosa de tablas y elementos de tablas HTML según su tipo de estructura y complejidad. El propósito de la investigación es extractar e integrar la información con el propósito de generar información estructurada bajo la forma documentos de tipo XML. Eje: V - Workshop de agentes y sistemas inteligentes Red de Universidades con Carreras en Informática (RedUNCI)