Trabajo de grado - Maestría
Desarrollo de un algoritmo, utilizando Machine Learning, para generar estrategias de arbitraje en coberturas de opciones sobre acciones
Fecha
2022-06-23Registro en:
instname:Universidad de los Andes
reponame:Repositorio Institucional Séneca
Autor
Morales Acevedo, Andrés
Institución
Resumen
La aplicación de técnicas de Machine Learning en finanzas ha generado valor para los agentes que las han implementado (Robust Tech House, 2020). No obstante, las investigaciones en el campo de valoración y compraventa de opciones se han centrado en Machine Learning supervisado y procesamiento de lenguaje natural, llevando a que todavía haya bastante por explorar en la implementación de aprendizaje por refuerzo y aprendizaje profundo (Goodell, Kumar, Lim, & Pattnaik, 2021). La presente investigación se centra en este campo y propone desarrollar un algoritmo de trading de opciones americanas tipo call sobre acciones, utilizando los precios intradía con intervalos de un minuto. El algoritmo desarrollado, dentro de la aplicación del aprendizaje por refuerzo, es de Q-Learning e incluye una red neuronal recurrente con una Gated Recurrent Unit. El resultado demuestra la capacidad del modelo por aprender las condiciones del ambiente, realizar predicciones y generar beneficios por trading hasta alcanzar costos netos de cobertura menores o iguales a cero. Machine Learning techniques in finance have created value for the agents that have implemented them (Robust Tech House, 2020). However, research in the field of option valuation and trading has focused on supervised machine learning and natural language processing, so there is still much to investigate in its application within reinforcement learning and deep learning (Goodell, Kumar, Lim, & Pattnaik, 2021). This study focuses on this field and proposes an algorithm for trading American call stock options using intraday prices at one-minute intervals. The algorithm developed implements Q-Learning, a reinforcement learning methodology, and includes a recurrent neural network with a Gated Recurrent Unit. The results demonstrate the ability of the model to learn the conditions of the environment, make predictions, and generate benefits from trading until the point where it reaches net hedging costs less than or equal to zero.