Trabajo de grado - Pregrado
Evaluación de políticas bajo ruido Markoviano mediante el algoritmo de Online Bootstrap Inference
Fecha
2023-06-06Registro en:
instname:Universidad de los Andes
reponame:Repositorio Institucional Séneca
Autor
Patrón Piñerez, Ana María
Institución
Resumen
Este trabajo estudia la evaluación de políticas en Aprendizaje Reforzado (RL) en escenarios de dimensión grande o con incertidumbre. En este caso, el valor de la política que se quiere evaluar se aproxima de manera lineal, y se desarrolla usando Aproximación Lineal Estocástica (LSA) con ruido Markoviano. Los métodos clásicos, Diferencias Temporales y Gradientes de Diferencias Temporales, son ineficientes al estimar la función valor. Por eso, se estudia la alternativa que ofrece el algoritmo de Online Bootstrap Inference, el cual promete ser una mejora a los métodos existentes.