Trabalho de Conclusão de Curso
Avaliação de topologia da rede neural e parâmetros do aprendizado de máquina por reforço para agentes jogadores de videogames
Registro en:
ROSA, Mateus de Freitas. Avaliação de topologia da rede neural e parâmetros do aprendizado de máquina por reforço para agentes jogadores de videogames. 2022. 46 f. Trabalho de Conclusão de Curso (Graduação em Sistemas de Informação) – Universidade Federal de Uberlândia, Uberlândia, 2022.
Autor
Rosa, Mateus de Freitas
Institución
Resumen
Reinforcement machine learning has been an important area in the field of artificial
intelligence due to its versatility and adaptability in complex settings, without the need
of a specialist supervisor. The use of images as input signals makes the intelligent agent
similar to how a human being makes decisions, using the image’s rich information.
In reinforcement learning with neural networks, performance is highly dependant on
the topology of the neural network and several lerarning parameters. Therefore, this aims
to develop an intelligent agent for playingt Atari 2600 videogames, while also proposing
changes to the topology and reinforcement learning parameters comapred to literature
methods.
Experimental results were successful in the evolution of the agent in maximizing
rewards, which shows the proposed topology and parameters are viable. Trabalho de Conclusão de Curso (Graduação) O aprendizado de máquina por reforço é uma área importante no ramo de inteligência
artificial devido a sua versatilidade e adaptabilidade em cenários complexos, sem necessitar de um supervisor especialista. O uso de imagens como sinais de entrada aproxima o
agente inteligente da forma em que o ser humano toma decisões, utilizando-se da riqueza
de informações da imagem.
Em aprendizado por reforço com redes neurais, o desempenho depende muito da topologia da rede neural e de diversos parâmetros do aprendizado. Nesse sentido, este trabalho
visa desenvolver um agente inteligente para jogos de Atari 2600 e também propõe alterações de topologia e parâmetros do aprendizado em relação a métodos da literatura.
Os resultados experimentais obtidos apresentam sucesso na evolução do agente na
maximização das recompensas, mostrando que as topologias e parâmetros propostos são
viáveis.