Neural networks that express multiple strategies in the video game StarCraft 2

González Duque, Miguel

dc.contributor	Cabarcas Jaramillo, Daniel
dc.creator	González Duque, Miguel
dc.date.accessioned	2020-03-30T06:38:31Z
dc.date.available	2020-03-30T06:38:31Z
dc.date.created	2020-03-30T06:38:31Z
dc.date.issued	2019-10-03
dc.identifier	https://repositorio.unal.edu.co/handle/unal/77095
dc.identifier	http://bdigital.unal.edu.co/74472/
dc.identifier	Universidad Nacional de Colombia
dc.identifier	Repositorio Institucional Universidad Nacional de Colombia
dc.identifier	https://repositorio.unal.edu.co/
dc.description.abstract	Using neural networks and supervised learning, we have created models capable of solving problems at a superhuman level. Nevertheless, this training process results in models that learn policies that average the plethora of behaviors usually found in datasets. In this thesis we present and study the Behavioral Repetoires Imitation Learning (BRIL) technique. In BRIL, the user designs a behavior space, the user then projects this behavior space into low coordinates and uses these coordinates as input to the model. Upon deployment, the user can adjust the model to express a behavior by specifying fixed coordinates for these inputs. The main research question ponders on the relationship between the Dimension Reduction algorithm and how much the trained models are able to replicate behaviors. We study three different Dimensionality Reduction algorithms: Principal Component Analysis (PCA), Isometric Feature Mapping (Isomap) and Uniform Manifold Approximation and Projection (UMAP); we design and embed a behavior space in the video game StarCraft 2, we train different models for each embedding and we test the ability of each model to express multiple strategies. Results show that with BRIL we are able to train models that are able to express the multiple behaviors present in the dataset. The geometric structure these methods preserve induce different separations of behaviors, and these separations are reflected in the models' conducts. (Tomado de la fuente)
dc.description.abstract	Usando redes neuronales y aprendizaje supervisado, hemos creado modelos capaces de solucionar problemas a nivel súperhumano. Sin embargo, el proceso de entrenamiento de estos modelos es tal que el resultado es una política que promedia todos los diferentes comportamientos presentes en el conjunto de datos. En esta tesis presentamos y estudiamos la técnica Aprendizaje por Imitación de Repertorios de Comportamiento (BRIL), la cual permite entrenar modelos que expresan múltiples comportamientos de forma ajustable. En BRIL, el usuario diseña un espacio de comportamientos, lo proyecta a bajas dimensiones y usa las coordenadas resultantes como entradas del modelo. Para poder expresar cierto comportamiento a la hora de desplegar la red, basta con fijar estas entradas a las coordenadas del respectivo comportamiento. La pregunta principal que investigamos es la relación entre el algoritmo de reducción de dimensionalidad y la capacidad de los modelos entrenados para replicar y expresar las estrategias representadas. Estudiamos tres algoritmos diferentes de reducción de dimensionalidad: Análisis de Componentes Principales (PCA), Mapeo de Características Isométrico (Isomap) y Aproximación y Proyección de Manifolds Uniformes (UMAP); diseñamos y proyectamos un espacio de comportamientos en el videojuego StarCraft 2, entrenamos diferentes modelos para cada embebimiento y probamos la capacidad de cada modelo de expresar múltiples estrategias. Los resultados muestran que, usando BRIL, logramos entrenar modelos que pueden expresar los múltiples comportamientos presentes en el conjunto de datos. La estructura geométrica preservada por cada método de reducción induce diferentes separaciones de los comportamientos, y estas separaciones se ven reflejadas en las conductas de los modelos. (Tomado de la fuente)
dc.language	eng
dc.publisher	Maestría en Ciencias - Matemática
dc.publisher	Escuela de Matemáticas
dc.publisher	Universidad Nacional de Colombia
dc.publisher	Facultad de Ciencias
dc.publisher	Medellín
dc.relation	Universidad Nacional de Colombia Sede Medellín Facultad de Ciencias Escuela de Matemáticas
dc.relation	Escuela de Matemáticas
dc.relation	51 Matemáticas / Mathematics
dc.relation	González Duque, Miguel (2019) Neural networks that express multiple strategies in the video game StarCraft 2. Maestría thesis, Universidad Nacional de Colombia, sede Medellín.
dc.rights	Atribución-NoComercial 4.0 Internacional
dc.rights	http://creativecommons.org/licenses/by-nc/4.0/
dc.rights	info:eu-repo/semantics/openAccess
dc.rights	Derechos reservados - Universidad Nacional de Colombia
dc.title	Neural networks that express multiple strategies in the video game StarCraft 2
dc.type	Trabajo de grado - Maestría

Este ítem pertenece a la siguiente institución

Universidad Nacional de Colombia