Dissertation
Macroeconomic forecasting: time series econometrics versus machine learning methods
Fecha
2022-04-11Autor
Mesquita, Eduardo Paro
Institución
Resumen
A área de previsão macroeconômica é um campo de estudo desafiador e ao mesmo tempo extremamente relevante, tanto para a academia quanto para diversos setores do mercado e do governo. Neste trabalho, realizamos uma comparação empírica do desempenho preditivo de modelos tradicionais de séries temporais e métodos de aprendizado estatístico (aprendizado de máquinas) para prever quatro indicadores econômicos mensais dos Estados Unidos usando um grande conjunto de preditores: produção industrial, número de empregados em setores não-agrícolas , inflação e o spread entre a taxa de vencimento constante do tesouro de 10 anos e a taxa de fundos federais (Fed funds). Constatamos que os modelos tradicionais de séries temporais são competitivos em vários cenários, em particular para as séries de produção industrial e número de empregados. Para a medida de spread de taxa de juros e especialmente para a inflação, os métodos de aprendizagem estatística superaram os modelos de séries temporais de forma consistente. Nesses casos, o Random Forest e o LASSO com defasagens não penalizadas da variável alvo merecem maior atenção para a previsão de inflação e spread de juros, respectivamente. Investigamos também o efeito da escolha do método de ajuste de hiperparâmetros para os modelos de regressão penalizados e obtivemos evidências a favor do uso de critérios de informação. Nossos resultados também sugerem que a combinação de previsões de séries temporais e modelos de aprendizado de máquinas tem um desempenho muito bom para a maioria das variáveis e horizontes de previsão analisados. Macroeconomic forecasting is a challenging but also relevant topic for both academics and practitioners. In this work we perform an empirical comparison of the forecasting performance of traditional time series models and statistical learning methods for forecasting four major monthly economic indicators of the United States using a large set of predictors: Industrial Production, Number of Employees, Inflation, and the spread between the 10-year Treasury Constant Maturity and the Federal Funds Rate. We find that traditional time series models remain competitive in several scenarios, in particular for the Industrial Production and Number of Employees series. For the interest rate spread and especially for Inflation, the statistical learning methods outperformed the time series models consistently. In these cases, the Random Forest and the LASSO with unpenalized lags of the target variable deserve the most attention for inflation and interest rate spread forecasting respectively. We investigated the effect of the choice of hyperparameter tuning method for the penalized regression models and obtained evidence in favor of the use of information criteria. We also find that the combination of forecasts from time series econometrics models and statistical learning methods perform very well for most variables and forecasting horizons analyzed.