Buscar
Mostrando ítems 1-3 de 3
Aplicação e comparação de métodos policy gradient em problema de cadeias de suprimentos multiestágio com incertezas
(Universidade Federal de Minas GeraisBrasilPrograma de Pós-Graduação em Ciência da ComputaçãoUFMG, 2021-10-06)
Deep Reinforcement Learning (DRL) methods have been increasingly used in several areas of knowledge and, recently, this interest has also grown in the Optimization community. In this work, we apply and compare Policy ...
Uma arquitetura de uso geral baseada em planejamento probabilístico para agentes completos em jogos de estratégia em tempo realA general purpose architecture based on probabilistic planning for full agents in real-time strategy games
(Universidade Federal de UberlândiaBrasilPrograma de Pós-graduação em Ciência da Computação, 2017)