Buscar
Mostrando ítems 1-10 de 241
Aprendizado por reforço profundo multiagente aplicado a negociação de ativos de mercado financeiro
(Centro Universitário FEI, São Bernardo do Campo, 2021)
O presente trabalho tem como motivação principal o estudo de modelos de aprendizado
por reforço multi-agent, comumente utilizados quando o problema é episódico e a dinâmica
do sistema é complexa de ser descrita analiticamente, ...
Aprendizado por reforço assistido por imitação para jogos digitais
(Universidade Federal de Juiz de Fora (UFJF)BrasilICE – Instituto de Ciências ExatasPrograma de Pós-graduação em Modelagem ComputacionalUFJF, 2023)
Drafting in collectible card games via reinforcement learning
(Universidade Federal de Minas GeraisBrasilICX - DEPARTAMENTO DE CIÊNCIA DA COMPUTAÇÃOPrograma de Pós-Graduação em Ciência da ComputaçãoUFMG, 2020-10-13)
Jogos de cartas colecionáveis (JCC), como Magic: the Gathering e Hearthstone, possuem atualmente dezenas de milhões de jogadores pelo mundo. Seus vastos espaços de estados, junto de suas complexas regras e grande quantidade ...
Aprendizado por reforço profundo explicável: um estudo com controle semafórico inteligente
(Universidade do Vale do Rio dos Sinos, 2022-02-18)
With the fast increase in urbanization levels, the problem of congestion has become even more evident for society, the environment, and the economy. One practical approach to alleviating this problem is adaptive traffic ...
Aprendizado por reforço profundo explicável: um estudo com controle semafórico inteligente
(Universidade do Vale do Rio dos Sinos, 2022-02-18)
With the fast increase in urbanization levels, the problem of congestion has become even more evident for society, the environment, and the economy. One practical approach to alleviating this problem is adaptive traffic ...
Aprendizado por reforço profundo multiagente aplicado a negociação de ativos de mercado financeiro
(Centro Universitário FEI, São Bernardo do Campo, 2021)
O presente trabalho tem como motivação principal o estudo de modelos de aprendizado
por reforço multi-agent, comumente utilizados quando o problema é episódico e a dinâmica
do sistema é complexa de ser descrita analiticamente, ...
Geração procedural de conteúdo utilizando aprendizado por reforço com design de iniciativa mista e entropia como feedback de recompensa
(Universidade Federal de Juiz de Fora (UFJF)BrasilICE – Instituto de Ciências ExatasPrograma de Pós-graduação em Ciência da ComputaçãoUFJF, 2023)
Evolution of reward functions for reinforcement learning applied to stealth games
(Universidade Federal de Juiz de Fora (UFJF)BrasilICE – Instituto de Ciências ExatasPrograma de Pós-graduação em Ciência da ComputaçãoUFJF, 2017)