Buscar

Mostrando ítems 1-3 de 3

Aplicação e comparação de métodos policy gradient em problema de cadeias de suprimentos multiestágio com incertezas

Julio César Alves (Universidade Federal de Minas GeraisBrasilPrograma de Pós-Graduação em Ciência da ComputaçãoUFMG, 2021-10-06)

Deep Reinforcement Learning (DRL) methods have been increasingly used in several areas of knowledge and, recently, this interest has also grown in the Optimization community. In this work, we apply and compare Policy ...

Anticipation in multiple criteria decision-making under uncertainty = Antecipação na tomada de decisão com múltiplos critérios sob incertezaAntecipação na tomada de decisão com múltiplos critérios sob incerteza

Azevedo, Carlos Renato Belo, 1984- ([s.n.], 2012)

Uma arquitetura de uso geral baseada em planejamento probabilístico para agentes completos em jogos de estratégia em tempo realA general purpose architecture based on probabilistic planning for full agents in real-time strategy games

Naves, Thiago França (Universidade Federal de UberlândiaBrasilPrograma de Pós-graduação em Ciência da Computação, 2017)