Tesis
Negociación algorítmica de acciones por medio de aprendizaje por refuerzo profundo
Fecha
2021-12-02Registro en:
Universidad Nacional de Colombia
Repositorio Institucional Universidad Nacional de Colombia
Autor
Giraldo Escobar, Santiago Alberto
Institución
Resumen
Este trabajo de grado tiene como finalidad explorar la utilización de series de tiempo financieras sintéticas generadas por un modelo de Redes Neuronales Generativas Adversarias (GAN por sus siglas en inglés) para entrenar un algoritmo de Aprendizaje Profundo Q Por Refuerzo que ejecute acciones de compra y venta para un título del mercado de valores del índice de Standard & Poor’s 500. Para el desarrollo del trabajo se empleó la metodología CRISP DM propuesta por IBM, entendiendo primero el negocio y la teoría necesaria para desarrollar los modelos, para continuar con la exploración y conocimiento de los datos disponibles que concordaran con los objetivos del estudio. En este se desarrolla un procedimiento para la selección de series ficticias y para el entrenamiento de un algoritmo por refuerzo con estos datos. Se utiliza la métrica de Kolmogorov - Smirnov como componente esencial para entrenar las redes GAN. Se explican los resultados de los experimentos, y se evidencia la dificultad para calibrar modelos generativos adversarios y de agentes entrenados por refuerzo. Por último, se presentan las conclusiones derivadas del trabajo y posibles investigaciones futuras. (Texto tomado de la fuente) This degree work aims to explore the use of synthetic financial time series generated by a Generative Adversarial Neural Networks (GAN) model to train a Deep Reinforcement Learning algorithm that executes buy and sell actions for a stock in the Standard & Poor's 500 index. For the implementation of the study, we used the CRISP methodology proposed by IBM, understanding first the business and the theory necessary to develop the models, to continue with the exploration and knowledge of the available data that matched the objectives of the project. In this paper, a procedure for selecting synthetic series and training a reinforcement algorithm with these data is developed. The Kolmogorov-Smirnov metric is used as an essential component to train GANs. The results of the experiments are explained, and the difficulty in calibrating generative adversarial and reinforcement network models is shown. Finally, conclusions derived from the project and possible future research are presented.