Processo de decisão de Markov limitados por linguagem

Pellegrini, Jeronimo

Language limited Markov decision processes

dc.creator	Pellegrini, Jeronimo
dc.date	2006
dc.date	2006-07-31T00:00:00Z
dc.date	2017-03-29T11:27:03Z
dc.date	2017-06-09T15:09:00Z
dc.date	2017-03-29T11:27:03Z
dc.date	2017-06-09T15:09:00Z
dc.date.accessioned	2018-03-29T02:21:10Z
dc.date.available	2018-03-29T02:21:10Z
dc.identifier	(Broch.)
dc.identifier	PELLEGRINI, Jeronimo. Processo de decisão de Markov limitados por linguagem. 2006. 136p. Tese (doutorado) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP. Disponível em: <http://libdigi.unicamp.br/document/?code=vtls000412307>. Acesso em: 29 mar. 2017.
dc.identifier	http://repositorio.unicamp.br/jspui/handle/REPOSIP/276256
dc.identifier.uri	http://repositorioslatinoamericanos.uchile.cl/handle/2250/1314618
dc.description	Orientador: Jacques Wainer
dc.description	Tese (doutorado) - Universidade Estadual de Campinas, Instituto de Computação
dc.description	Resumo: Processos de decisão de Markov (MDPs) são usados para modelar situações onde é necessário executar ações em sequência em ambientes com incerteza. Este trabalho define uma nova formulação dos processos de decisão de Markov, adicionando a estes a possibilidade de restringir as ações e observações a serem consideradas a cada época de decisão. Estas restrições são descritas na forma de um autômato finito ? assim, a sequência de possíveis ações e observações consideradas na busca pela política ótima passa a ser uma linguagem regular. Chamamos estes processos de Markov limitados por linguagem (LLMDPs e LL-POMDPs). O uso de autômatos para a especificação de restrições facilita o processo de modelagem de problemas. Apresentamos diferentes abordagens para a solução destes problemas, e comparamos seus desempenhos, mostrando que a solução é viável, e mostramos também que em algumas situações o uso de restrições pode ser usado para acelerar a busca por uma solução. Além disso, apresentamos uma modificação nos LLPOMDPs de forma que seja possível especificar duração probabilística discreta para as ações e observações
dc.description	Abstract: Markov decision processes (MDPs) are used to model situations where one needs to execute sequences of actions under uncertainty. This work defines a new formulation of Markov decision processes, with the possibility of restricting the actions and observations to be considered at each decision epoch. These restrictions are described as a finite automation, so the sequence of possible actions (and observations) considered during the search for an optimal policy is a regular language. We call these ?language limited Markov decision processes (LL-MDPs and LL-POMDPs). The use of automata for specifying restrictions helps make the modeling process easier. We present different approaches to solve these problems, and compare their performance, showing that the solution is feasible, and we also show that in some situations some restrictions can be used to speed up the search for a solution. Besides that, we also present one modification on LL-POMDPs to make it possible to specify probabilistic discrete duration for actions and observations
dc.description	Doutorado
dc.description	Sistemas de Informação
dc.description	Doutor em Ciencia da Computação
dc.format	136p. : il.
dc.format	application/octet-stream
dc.language	Português
dc.publisher	[s.n.]
dc.subject	Inteligência artificial
dc.subject	Probabilidades
dc.subject	Teoria da decisão
dc.subject	Markov, Processos de
dc.subject	Artificial intelligence
dc.subject	Probability
dc.subject	Decision theory
dc.subject	Markoff processes
dc.title	Processo de decisão de Markov limitados por linguagem
dc.title	Language limited Markov decision processes
dc.type	Tesis

Este ítem pertenece a la siguiente institución

Universidade Estadual de Campinas (Brasil)