Tesis de maestría
Aprendizaje de la estructura de redes Bayesianas usando recocido simulado y criterio Bayesiano
Fecha
2004-05-01Autor
Carrillo Rincón, Miguel Ángel
Institución
Resumen
En la actualidad existen muchos problemas de dominios tan diversos como medicina, pronóstico del tiempo, mercado del petróleo, telecomunicaciones, etc., los cuales requieren de modelos que nos permitan razonar bajo incertidumbre y tomar decisiones aun cuando nuestro conocimiento sobre los eventos que se presentan es limitado. Para modelar los problemas antes mencionados y razonar bajo incertidumbre, la comunidad de inteligencia artificial basándose en la teoría de probabilidad y en teoría Bayesiana ha desarrollado modelos probabilísticos denominados redes Bayesianas. Una red Bayesiana es un grafo acíclico dirigido (DAG) en donde los nodos representan variables aleatorias y los arcos entre variables representan relaciones de causalidad. Sin embargo, el principal obstáculo para el uso de estas redes es su construcción en dominios complejos. Un enfoque muy promisorio para resolver este problema es tratar de construir automáticamente, o aprender tales representaciones de conjuntos de datos. Para esto, existen dos vertientes, enfoque de búsqueda y evaluación que busca explorar el espacio de soluciones posibles para encontrar aquella red que mejor evaluación presente de acuerdo a cierta medida de desempeño y análisis de dependencias que busca analizar las características inherentes de una red Bayesiana realizando pruebas de independencia e independencia condicional. En esta investigación se presenta un algoritmo al que hemos llamado SABS y el cual está basado en el enfoque de búsqueda y evaluación, utilizando el algoritmo de optimización recocido simulado como método de búsqueda y el criterio Bayesiano como medida de evaluación. Este algoritmo aprende la estructura de una red Bayesiana a partir de un conjunto completo de datos, pero si dicho conjunto carece de algunos valores, SABS es capaz de realizar la tarea de aprendizaje ya que se realiza un preprocesamiento mediante la implementación de la primera etapa del algoritmo EM para inferir los valores faltantes.