Dissertation
Random Forest: uma investigação da eficiência de mercado de ações da Vale
Fecha
2018-12-12Autor
Szyszka, Pedro Xaxier
Institución
Resumen
O presente trabalho investigou sobre a aleatoriedade dos preços do ativo VALE3 negociado na Bolsa de Valores de São Paulo. Utilizamos a metodologia Random Forest para tentar prever sinais de retornos de 15min futuros. Através do modelo, conseguimos extrair caráter preditivo de sinais de retornos com 95% de significância
estatística. Em especial, observamos a evolução de caráter preditivo com o aumento da janela de dados do modelo. Assim, conseguimos refutar a hipótese de passeio aleatório dos preços (random walk) para retornos de 15 minutos. Além disso, discutimos ao longo do texto as hipóteses utilizadas, assim como levantamos temas
para estudos futuros acerca da hipótese de eficiência de mercado ainda sob a ótica da metodologia de aprendizado computacional, como aumento de base de dados e utilização de dados que carreguem informações acerca das expectativas dos agentes. Por fim, apresentamos brevemente os resultados obtidos do mesmo método aplicado a diferentes janelas de predição. The present work investigated the randomness of the prices of the VALE3 asset traded on the São Paulo Stock Exchange. We used the Random Forest methodology to try to predict signs of 15min future returns. Through the model we were able to extract a predictive character of signals of returns with 95% of statistical significance.
Particularly, we observe the evolution of a predictive character with an increase in the model data window. Thus, we were able to refute the random walk hypothesis for 15-
minute returns. In addition, we have discussed the hypotheses used throughout the text, as well as raising topics for future studies about the hypothesis of market
efficiency still from the perspective of computational learning methodology, such as increasing the database and using data that carries information about expectations of the agents. Finally, we briefly present the results obtained from the same method applied to different prediction windows.