Buscar
Mostrando ítems 11-20 de 30
Aprendizado por reforço profundo explicável: um estudo com controle semafórico inteligente
(Universidade do Vale do Rio dos Sinos, 2022-02-18)
With the fast increase in urbanization levels, the problem of congestion has become even more evident for society, the environment, and the economy. One practical approach to alleviating this problem is adaptive traffic ...
Aprendizado por reforço profundo multiagente aplicado a negociação de ativos de mercado financeiro
(Centro Universitário FEI, São Bernardo do Campo, 2021)
O presente trabalho tem como motivação principal o estudo de modelos de aprendizado
por reforço multi-agent, comumente utilizados quando o problema é episódico e a dinâmica
do sistema é complexa de ser descrita analiticamente, ...
Framework de apoio à tomada de decisão no mercado de ações baseado em aprendizado por reforço profundo
(2021-07-09)
No mercado de ações, investidores adotam diferentes estratégias para identificar
uma sequência de decisões de investimento a fim de maximizar seus lucros. Para apoiar a
decisão dos investidores, uma framework de aprendizado ...
A Profile-Based architecture for traffic forwarding through service function chaining using deep reinforcement learning techniques
(Centro Universitário FEI, São Bernardo do Campo, 2022)
Aprendizado por reforço profundo multiagente aplicado a negociação de ativos de mercado financeiro
(Centro Universitário FEI, São Bernardo do Campo, 2021)
O presente trabalho tem como motivação principal o estudo de modelos de aprendizado
por reforço multi-agent, comumente utilizados quando o problema é episódico e a dinâmica
do sistema é complexa de ser descrita analiticamente, ...
Aprendizagem por reforço profundo uma nova perspectiva sobre o problema dos k-servos
(Universidade Federal do Rio Grande do NorteBrasilUFRNPROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA E DE COMPUTAÇÃO, 2020-01-28)
The k-server problem in a weighted graph (or metric space) is defined by the need to
efficiently move k servers to fulfill a sequence of requests that arise online at each graph
node. This is perhaps the most influential ...
Tomada de decisão sob incerteza e aprendizado por reforço na área de saúde - uma aplicação envolvendo um sistema de distribuição autônoma hospitalar
(Universidade Federal de São Paulo, 2021-02-19)
É inegável a crescente pressão por redução de custos no setor da saúde que países do mundo todo vem enfrentando nos últimos anos, tendência acelerada por fatores demográficos, como crescimento e envelhecimento populacional, ...
A Profile-Based architecture for traffic forwarding through service function chaining using deep reinforcement learning techniques
(Centro Universitário FEI, São Bernardo do Campo, 2021)
Os sistemas de comunicação, como por exemplo as redes móveis de quinta geração (5G)
têm se desenvolvido rapidamente e devido à esta evolução, o uso dos seus recursos tem se tornado
mais complexo. Assim, são necessários ...
Aplicação e comparação de métodos policy gradient em problema de cadeias de suprimentos multiestágio com incertezas
(Universidade Federal de Minas GeraisBrasilPrograma de Pós-Graduação em Ciência da ComputaçãoUFMG, 2021-10-06)
Deep Reinforcement Learning (DRL) methods have been increasingly used in several areas of knowledge and, recently, this interest has also grown in the Optimization community. In this work, we apply and compare Policy ...
Action Branching em redes de Aprendizado por Reforço profundo para reduzir dimensionalidade de espaço de ações discretoAction Branching in Deep Reinforcement Learning networks to reduce dimensionality of discrete action space
(Universidade Federal do Rio Grande do NorteBrasilUFRNEngenharia de ComputaçãoDepartamento de Engenharia de Computação e Automação, 2022)