Zero-sum Markov games on Borel spaces withnon-constant discount factors and unboundedpayo↵
Autor
PIVAC ALCARAZ, ESTEPHANIA; 711365
PIVAC ALCARAZ, ESTEFHANIA
Institución
Resumen
Tesis de maestría en ciencias especialidad matemáticas Este trabajo trata con tres clases diferentes de juegos de Markov descontados de suma cero en tiempo discreto con factores de descuento no constantes, a saber, juegos 1, donde el proceso de estado {xn} y el proceso de descuento {αn} evolucionan de acuerdo a un ley de transición acoplada Q. 2 con factores de descuento dependientes de acciones estatales de la forma α(xn, an, bn), donde an y bn representan las acciones de los jugadores 1 y 2, en el tiempo, respectivamente; 3 con factores de descuento dependientes de acciones estatales aleatorias de la forma α(xn, an, bn, ξn+1), donde {ξn} es el proceso de perturbación de los factores de descuento, que es una secuencia de variables aleatorias independientes e idénticamente distribuidas.
En general, un juego de suma cero para dos personas es un juego para dos jugadores en el que la ganancia de un jugador representa el costo del otro. Entonces, mientras que el objetivo del jugador 1 es maximizar su pago, el objetivo del jugador 2 es minimizar su costo. El objetivo principal es demostrar la existencia de un valor del juego, así como estrategias óptimas para ambos jugadores, para cada La motivación natural para considerar factores de descuento no constantes proviene de las aplicaciones en modelos económicos y financieros donde, en general, los factores de descuento son funciones de las tasas de interés que a su vez son inciertas. Diferentes hechos, por ejemplo, la cantidad de moneda en circulación y / o acciones de los jugadores, y además, ruidos aleatorios. En estos casos tenemos factores de descuento no constantes, para los cuales la teoría habitual sobre juegos de Markov descontados con factores de descuento constantes es no aplica. Universidad de Sonora. División de Ciencias Exactas y Naturales. Programa de Posgrado en Matemáticas, 2017.