Trabajo de grado - Pregrado
Evaluación comparativa de modelos estadísticos y de aprendizaje automático para el pronóstico de series de tiempo
Registro en:
Universidad Tecnológica de Pereira
Repositorio Institucional Universidad Tecnológica de Pereira
Autor
Mosquera Collazos , Cristian Camilo
Institución
Resumen
En el trabajo se aborda un experimento mediante el cual se explora la idea de un aproximador universal de series de tiempo, comparando tres diferentes algoritmos de aprendizaje automático y dos estadísticos; Para esto primero se generan diferentes series de tiempo utilizando un algoritmo de caminata aleatoria con el fin de generar datos sintéticos que presentan distribuciones de probabilidad escogidas en la investigación. Con esos datos generados se analizan los resultados del pronóstico de los modelos a diferentes fronteras de tiempo.
Al final se presentan tres casos de uso para los pronósticos de series de tiempo en la optimización de portafolios de inversión, en predecir el precio de la TRM y predecir el comportamiento de un índice económico. The paper deals with an experiment through which the idea of a universal approximator of time series, comparing three different machine learning algorithms and two statistics; For this, different time series are first generated using a random walk algorithm in order to generate synthetic data that present probability distributions chosen in the investigation. With these generated data, the forecast results of the models are analyzed at different time frontiers.
At the end, three use cases are presented for time series forecasts in the optimization of investment portfolios, in predicting the price of the TRM and in predicting the behavior of an economic index. Pregrado Ingeniero(a) Industrial Indice general
Introducción 11
Materias de Investigación 13
L´ımite o alcance 15
Problema de investigación 17
1. Planteamiento del problema . . . . . . . . . . . . . . . . . . . 18
2. Formulación del problema . . . . . . . . . . . . . . . . . . . . 18
3. Sistematización del problema . . . . . . . . . . . . . . . . . . 18
4. Beneficios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
Justificación 20
Objetivos 23
5. Objetivo general . . . . . . . . . . . . . . . . . . . . . . . . . 23
6. Objetivos específicos . . . . . . . . . . . . . . . . . . . . . . . 23
Marcos de referencia 24
7. Marco te´orico . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
7.1. Pron´ostico de series de tiempo . . . . . . . . . . . . . . 26
7.2. Data Science y pron´ostico de series de tiempo . . . . . 29
7.3. Modelos estad´ısticos de pron´ostico . . . . . . . . . . . 29
7.4. Modelos de aprendizaje autom´atico . . . . . . . . . . . 32
7.5. Preprocesamiento de datos . . . . . . . . . . . . . . . . 41
7.6. Simulaci´on de series de tiempo utilizando el algoritmo
Metropolis–Hastings . . . . . . . . . . . . . . . . . . . 42
7.7. Pruebas de bondad y ajuste . . . . . . . . . . . . . . . 43
8. Marco conceptual . . . . . . . . . . . . . . . . . . . . . . . . . 44
4
´INDICE GENERAL 5
9. Marco espacial . . . . . . . . . . . . . . . . . . . . . . . . . . 45
10. Marco temporal . . . . . . . . . . . . . . . . . . . . . . . . . . 45
Metodolog´ıa de la investigaci´on 47
11. Tipo de investigaci´on . . . . . . . . . . . . . . . . . . . . . . . 47
12. Dise˜no de la investigaci´on . . . . . . . . . . . . . . . . . . . . 47
Dise˜no del experimento 49
13. Generar muestras utilizando el algoritmo metropolis . . . . . . 51
14. Modelos Estad´ısticos y de Aprendizaje Autom´atico . . . . . . 56
14.1. M´etodo de la ventana deslizante . . . . . . . . . . . . . 56
14.2. Modelo ARIMA . . . . . . . . . . . . . . . . . . . . . . 58
14.3. Modelo Suavizamiento exponencial . . . . . . . . . . . 59
14.4. Modelo Perceptr´on Multicapa . . . . . . . . . . . . . . 60
14.5. Modelo kNN regresi´on . . . . . . . . . . . . . . . . . . 61
14.6. Modelo LSTM . . . . . . . . . . . . . . . . . . . . . . . 61
15. Preprocesamiento . . . . . . . . . . . . . . . . . . . . . . . . . 62
Resultados del experimento 63
16. ARIMA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
16.1. Resultado de los par´ametros ARIMA . . . . . . . . . . 63
16.2. ARIMA Resultados . . . . . . . . . . . . . . . . . . . . 65
17. Suavizamiento exponencial . . . . . . . . . . . . . . . . . . . . 71
17.1. Resultado de par´ametros Suavizamiento exponencial . 72
17.2. Resultados Suavizamiento Exponencial . . . . . . . . . 74
17.3. Complejidad computacional Suavizamiento Exponencial 76
18. kNN regresi´on . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
18.1. Resultados kNN regresi´on sin preprocesamiento . . . . 77
18.2. Resultados kNN con normalizaci´on . . . . . . . . . . . 78
18.3. Complejidad computacional kNN . . . . . . . . . . . . 82
18.4. Conclusiones kNN . . . . . . . . . . . . . . . . . . . . 83
19. MLP . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
19.1. Resultados MLP . . . . . . . . . . . . . . . . . . . . . 84
19.2. Complejidad computacional MLP . . . . . . . . . . . . 85
19.3. Conclusiones MLP . . . . . . . . . . . . . . . . . . . . 86
20. LSTM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
20.1. LSTM Resultados . . . . . . . . . . . . . . . . . . . . . 86
20.2. Complejidad computacional LSTM . . . . . . . . . . . 87
´INDICE GENERAL 6
20.3. Conclusiones LSTM . . . . . . . . . . . . . . . . . . . 88
21. Conclusiones del experimento . . . . . . . . . . . . . . . . . . 88
Casos de aplicaci´on 90
22. Producci´on de energ´ıa . . . . . . . . . . . . . . . . . . . . . . 90
23. Caso TRM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
24. Caso Portafolio de inversi´on . . . . . . . . . . . . . . . . . . . 100
A. Algoritmo Metropolis- KStest 106
B. Modelos Estad´ısticos 110
1. Ventana deslizante . . . . . . . . . . . . . . . . . . . . . . . . 110
2. ARIMA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
2.1. C´alculo de par´ametros . . . . . . . . . . . . . . . . . . 114
3. Suavizamiento Exponencial . . . . . . . . . . . . . . . . . . . 115
3.1. Algoritmo gen´etico . . . . . . . . . . . . . . . . . . . . 116
C. Modelos de Aprendizaje Autom´atico 118
1. kNN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
2. MLP . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120
3. LSTM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
D. Caso de Aplicación 126
1. IPG . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126
2. TRM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
3. Portafolio de inversi´on . . . . . . . . . . . . . . . . . . . . . . 128