Control minimax de sistemas estocásticos a tiempo discreto con criterio de costo descontado
Autor
ALMADA VALENZUELA, LUZ ESMERALDA
ALMADA VALENZUELA, LUZ ESMERALDA
Institución
Resumen
Tesis de licenciatura en matemáticas El objetivo de este trabajo es estudiar sistemas de control minimax a tiempo discreto, los cuales consisten en lo siguiente. En contraste con los problemas de control óptimo estándar, en los que solo hay un único responsable de tomar las decisiones, en los problemas de control minimx existen dos tomadores de decisiones, el controlador mismo y un "oponente". Su evolución en el tiempo se puede describir de la siguiente manera. Al tiempo t, cuando el estado del sistema es x1=x, el controlador elige una acción at = a y el oponente elige una acción bt = b. Entonces, el controlador paga un costo c(x, a, b) al oponente, y el sistema se mueve a un nuevo estado xt+1=y de acuerdo con una probabilidad de transición Px-y(a, b). Una vez que el sistema se encuentra en el estado y, de nuevo el controlador y el oponente eligen sus respectivas acciones y el proceso se repite una y otra vez. Los costos se acumulande acuerdo a un funcional de costo total considerando horizonte, ya sea, finito o infinito. Por lo tanto el objetivo del controlador es minimizar el máximo costo generado por el oponente. Un caso particular de sistemas de control minimax es cuando la evolución del sistema está determinada por una ecuación en diferencias estocástica de la forma x+1 = F(xt, at, bt,et), t=0, 1,..., donde F es una función dada y (Et) es una sucesión de variables aleatorias conocido como proceso de perturbaciones aleatorias. En este caso, la probabilidad de transición queda determinada por la función F y la distribución correspondiente de las variables aleatorias. Universidad de Sonora, División de Ciencias Exactas y Naturales, 2018