info:eu-repo/semantics/masterThesis
Aprendizaje por transferencia de redes bayesianas
Autor
ROGER LUIS VELAZQUEZ
Resumen
In several domains, it is common to have data from different, but closely related problems (this
means that the distributions of the data are similars but no equals). For instance, in manufacturing
many products follow the same industrial process but with different conditions; or in
industrial diagnosis, where there is equipment with similar specifications. In these cases, it is
common to have plenty of data for some scenarios but very little for other, for example, for rare
products of little production. When there are a lot of data they can induce models from which
can be used in diagnosis and classification tasks. However, as the exactitude of the induced
model is based on the data available, having relatively little data are obtained very poor models.
In order to improve the accuracy of models for learning domains with little data, one possibility is
to use data and knowledge of similar domains. Using knowledge of similar domains has already
been addressed in previous works introducing techniques known as MULTITASK LEARNING, whose
objective is to improve multiple models simultaneously, or otherwise improve a single model
using techniques known as TRANSFER LEARNING. The bayesians networks have not been used
with the mentioned techniques previously. In this thesis, we propose a transfer learning method
to learn Bayesian networks that considers both, structure and parameter learning. For structure
learning, we use conditional independence tests, by combining measures from the target domain
with those obtained from one or more auxiliary domains, transferring information from the
most related domains with the aim of improving the accuracy of the less reliable parts of the
network. For parameter learning, it’s compared three techniques for probability aggregation that
combine probabilities estimated from the target domain with the auxiliary data. Through these
techniques is to address two related problems: the lack of information in the domains with little
data using domains related and a way of transferring knowledge from those domains related
retaining characteristics of the target model. To validate the approach, are used three standard
Bayesian networks commonly used in literature, and generated variants of each model by changing the structure as well as the parameters. Then learned on one of the variants with a small
data set and combined it with information from the other variants. En muchos dominios, es común tener datos de problemas similares (entendiéndose así porque
las distribuciones de los datos son parecidos entre sí pero no iguales). Por ejemplo, en la industria
se tienen muchos productos que se obtienen por el mismo proceso industrial pero con
diferentes condiciones; o en el diagnóstico industrial donde se encuentran equipos con especificaciones
similares. En estos casos, es común tener una gran cantidad de datos para algunos
escenarios pero muy pocos para otros, por ejemplo, para productos raros de poca producción.
Cuando se cuenta con muchos datos se pueden inducir modelos a partir de éstos que pueden
ser utilizados en tareas de diagnóstico y clasificación. Sin embargo, como la exactitud del modelo
inducido está en función de los datos disponibles, al tener relativamente pocos datos se
obtienen modelos muy pobres. Con el objetivo de mejorar la exactitud del aprendizaje de modelos
para dominios con pocos datos, una posibilidad es utilizar datos y conocimiento de dominios
similares. Utilizar conocimiento de dominios similares ya ha sido abordado en la literatura presentándose
técnicas conocidas como APRENDIZAJE DE MÚLTIPLES TAREAS, cuyo objetivo es
mejorar múltiples modelos simultáneamente, o en otros casos mejorar un único modelo utilizando
técnicas de APRENDIZAJE POR TRANSFERENCIA. Las redes bayesianas no han sido
muy utilizadas con las técnicas mencionadas anteriormente. En esta tesis, se propone utilizar
aprendizaje por transferencia en métodos de obtención de la estructura y parámetros de redes
bayesianas a partir de datos. Para el aprendizaje estructural, se usan pruebas de independencia
condicional, combinando medidas desde el dominio objetivo con las obtenidas de uno o
más de los dominios auxiliares, transfiriendo información desde los dominios más relacionados
con el objetivo de mejorar la precisión de las partes menos confiables de la red. Para el aprendizaje
paramétrico, se compararon técnicas de agregación de probabilidades que combinan
las probabilidades estimadas de los datos con los datos auxiliares. Mediante estas técnicas se
trata de abordar dos problemas relacionados: la falta de información en los dominios con pocos
datos utilizando problemas relacionados y una manera de transferir conocimiento desde problemas
relacionados conservando aquellas características propias del modelo objetivo.
Materias
Ítems relacionados
Mostrando ítems relacionados por Título, autor o materia.
-
Compendio de innovaciones socioambientales en la frontera sur de México
Adriana Quiroga -
Caminar el cafetal: perspectivas socioambientales del café y su gente
Eduardo Bello Baltazar; Lorena Soto_Pinto; Graciela Huerta_Palacios; Jaime Gomez -
Material de empaque para biofiltración con base en poliuretano modificado con almidón, metodos para la manufactura del mismo y sistema de biofiltración
OLGA BRIGIDA GUTIERREZ ACOSTA; VLADIMIR ALONSO ESCOBAR BARRIOS; SONIA LORENA ARRIAGA GARCIA