Aprendizaje por transferencia de redes bayesianas

ROGER LUIS VELAZQUEZ

info:eu-repo/semantics/masterThesis

Registro en:

http://inaoe.repositorioinstitucional.mx/jspui/handle/1009/401

https://repositorioslatinoamericanos.uchile.cl/handle/2250/7805619

Autor

ROGER LUIS VELAZQUEZ

Institución

Instituto Nacional de Astrofísica, Óptica y Electrónica (México)

Resumen

In several domains, it is common to have data from different, but closely related problems (this means that the distributions of the data are similars but no equals). For instance, in manufacturing many products follow the same industrial process but with different conditions; or in industrial diagnosis, where there is equipment with similar specifications. In these cases, it is common to have plenty of data for some scenarios but very little for other, for example, for rare products of little production. When there are a lot of data they can induce models from which can be used in diagnosis and classification tasks. However, as the exactitude of the induced model is based on the data available, having relatively little data are obtained very poor models. In order to improve the accuracy of models for learning domains with little data, one possibility is to use data and knowledge of similar domains. Using knowledge of similar domains has already been addressed in previous works introducing techniques known as MULTITASK LEARNING, whose objective is to improve multiple models simultaneously, or otherwise improve a single model using techniques known as TRANSFER LEARNING. The bayesians networks have not been used with the mentioned techniques previously. In this thesis, we propose a transfer learning method to learn Bayesian networks that considers both, structure and parameter learning. For structure learning, we use conditional independence tests, by combining measures from the target domain with those obtained from one or more auxiliary domains, transferring information from the most related domains with the aim of improving the accuracy of the less reliable parts of the network. For parameter learning, it’s compared three techniques for probability aggregation that combine probabilities estimated from the target domain with the auxiliary data. Through these techniques is to address two related problems: the lack of information in the domains with little data using domains related and a way of transferring knowledge from those domains related retaining characteristics of the target model. To validate the approach, are used three standard Bayesian networks commonly used in literature, and generated variants of each model by changing the structure as well as the parameters. Then learned on one of the variants with a small data set and combined it with information from the other variants.

En muchos dominios, es común tener datos de problemas similares (entendiéndose así porque las distribuciones de los datos son parecidos entre sí pero no iguales). Por ejemplo, en la industria se tienen muchos productos que se obtienen por el mismo proceso industrial pero con diferentes condiciones; o en el diagnóstico industrial donde se encuentran equipos con especificaciones similares. En estos casos, es común tener una gran cantidad de datos para algunos escenarios pero muy pocos para otros, por ejemplo, para productos raros de poca producción. Cuando se cuenta con muchos datos se pueden inducir modelos a partir de éstos que pueden ser utilizados en tareas de diagnóstico y clasificación. Sin embargo, como la exactitud del modelo inducido está en función de los datos disponibles, al tener relativamente pocos datos se obtienen modelos muy pobres. Con el objetivo de mejorar la exactitud del aprendizaje de modelos para dominios con pocos datos, una posibilidad es utilizar datos y conocimiento de dominios similares. Utilizar conocimiento de dominios similares ya ha sido abordado en la literatura presentándose técnicas conocidas como APRENDIZAJE DE MÚLTIPLES TAREAS, cuyo objetivo es mejorar múltiples modelos simultáneamente, o en otros casos mejorar un único modelo utilizando técnicas de APRENDIZAJE POR TRANSFERENCIA. Las redes bayesianas no han sido muy utilizadas con las técnicas mencionadas anteriormente. En esta tesis, se propone utilizar aprendizaje por transferencia en métodos de obtención de la estructura y parámetros de redes bayesianas a partir de datos. Para el aprendizaje estructural, se usan pruebas de independencia condicional, combinando medidas desde el dominio objetivo con las obtenidas de uno o más de los dominios auxiliares, transfiriendo información desde los dominios más relacionados con el objetivo de mejorar la precisión de las partes menos confiables de la red. Para el aprendizaje paramétrico, se compararon técnicas de agregación de probabilidades que combinan las probabilidades estimadas de los datos con los datos auxiliares. Mediante estas técnicas se trata de abordar dos problemas relacionados: la falta de información en los dominios con pocos datos utilizando problemas relacionados y una manera de transferir conocimiento desde problemas relacionados conservando aquellas características propias del modelo objetivo.