Tesis
Nuevo Modelo de Red Neuronal para Aprendizaje Supervisado Basado en Aprendizaje por Refuerzo con Valores de Influencia
Fecha
2018Autor
Valdivia Ballesteros, Andre´ Mauricio
Institución
Resumen
La auto-organización neuronal es una caracteríıstica innata en los cerebros de los mamíıferos, y es muy necesaria para su operación. Los modelos de redes neuronales artificiales más conocidos que usan esta caracteríıstica son los mapas auto- organizados (SOM) y las redes de teoría de resonancia adaptativa (ART), pero estos modelos, no toman a la neurona como una unidad de procesamiento, como su contraparte biológica; además que son modelos mayormente usados para el paradigma de aprendizaje no supervisado, esto quiere decir, que no se cuenta con modelos robustos auto-organizados en el paradigma de aprendizaje supervisado. En otro sentido, el paradigma de aprendizaje por refuerzo con valores de influencia, usado en sistemas multi-agentes, prueban que los agentes se pueden comunicar entre ellos, y que pueden auto-organizarse para asignarse tareas, sin ninguna interferencia. Motivados por estas características faltantes en las redes neuronales artificiales, y con el algoritmo de aprendizaje por refuerzo con valores de influencia se propone un nuevo modelo de red neuronal enfocado en el resolver problemas de aprendizaje supervisado, usando a los agentes de aprendizaje por refuerzo como neuronas en nuestro modelo; modelo que tiene como una característica importante las diferentes funciones de activación, dado que son únicas para cada neurona. Esta característica es importante también para la auto-organización. Los agentes neuronales funcionarán en un espacio discreto, además de usar un algoritmo de aprendizaje distinto a la propagación del error, el cual es usado en muchas redes. Se propone un algoritmo inspirado en la forma en que las redes SOM propagan su conocimiento, y de esta forma los estados aledaóos al estado entrenado puedan adquirir el conocimiento de este. Para probar la funcionalidad de este modelo, se usaron bases de datos de baja di- mensionalidad, y se comparó su desempeño con un perceptrón multicapa, donde en la mayoría de las bases de datos se mejoró el rendimiento de este. La creación de este nuevo modelo, es la base para posteriores investigaciones, donde la impor- tancia fundamental de este trabajo es el nuevo concepto de neurona.