Trabalho de conclusão de curso de graduação
Previsão da inflação brasileira com modelos de alta dimensionalidade
Fecha
2023-06-28Registro en:
SILVA, Lucas Oliveira Costa da. Previsão da inflação brasileira com modelos de alta dimensionalidade. 2023. 60 f. Trabalho de Conclusão de Curso (Bacharel em Ciências Econômicas) – Universidade Federal de São Paulo, Escola Paulista de Política, Economia e Negócios, Osasco, 2023.
Autor
Silva, Lucas Oliveira Costa da [UNIFESP]
Institución
Resumen
O presente trabalho propõe-se a aplicar diversos modelos econométricos de alta dimensionalidade para prever a inflação oficial brasileira em tempo real (medida pelo IPCA) e verificar se há alguma mudança de performance dos modelos em razão da crise do Covid-19. Para isso, todos os modelos são estimados por meio de janela móvel e crescente de pelo menos oito anos, com a primeira previsão de dezembro de 2011 até janeiro de 2023. E para verificar o efeito do Covid-19 no desempenho dos modelos, dividiu-se a análise em três períodos distintos. No primeiro, analisou-se a performance dos modelos em todo horizonte temporal das previsões, isto é, de dezembro de 2011 a janeiro de 2023. No segundo, considerou-se o período de dezembro de 2011 a fevereiro de 2020, denominado de pré-pandemia. E o período de pandemia de março de 2020 a janeiro de 2023. E para lidar com o grande volume de preditores (cerca de 215 variáveis ou 1075, tendo em conta as variáveis defasadas), considerou-se o uso da abordagem de machine learning. As metodologias propostas são abordagens lineares e não lineares. Entre os modelos lineares, utiliza-se os métodos shrinkage (regressões Ridge, LASSO, adaLASSO, Elastic Net e adaElastic Net). O random forest consiste na abordagem não linear aplicada. O trabalho prevê o IPCA de 1 a 12 meses à frente e analisa a performance dos modelos por meio da raiz erro quadrático médio (RMSE) em comparação com a estimativa de benchmark padrão, tal como o modelo autorregressivo de primeira ordem (AR) e o random walk (RW). A análise pela raiz do erro quadrático médio mostrou que o modelo AR obteve a melhor performance em todos os períodos analisados (toda a janela de previsões, o de pré-pandemia e o da pandemia). O random forest é o modelo de machine learning com desempenho mais próximo do AR, porém não o supera. Já os demais modelos shrinkage apresentaram uma performance bem abaixo do benchmark AR. Entretanto, todos os modelos superaram o benchmark RW. Quanto aos efeitos do período de pandemia, há evidências de que o Covid-19 prejudicou a maioria dos modelos via aumento de RMSE. Porém, tornou o desempenho do AR predominante sobre os demais modelos. Sendo, portanto, uma mudança de padrão uma vez que no pré-pandemia o AR era relevante, mas não predominava. This paper proposes to apply several high-dimensional econometric models to forecast Brazilian official inflation in real time (measured by IPCA) and to verify whether there
is any change in the models' performance due to the Covid-19 crisis. To do so, all models are estimated using a moving and increasing window of at least eight years,
with the first forecast from December 2011 to January 2023. And to verify the effect of Covid-19 on model performance, the analysis was divided into three distinct periods. In the first, the performance of the models was analyzed over the entire time horizon of the forecasts, that is, from December 2011 to January 2023. In the second, we considered the period from December 2011 to February 2020, called pre-pandemic. And the pandemic period from March 2020 to January 2023. And to deal with the large
volume of predictors (about 215 variables or 1075, taking into account lagged variables), the use of machine learning approach was considered. The proposed
methodologies are linear and non-linear approaches. Among the linear models, the shrinkage methods (Ridge regressions, LASSO, adaLASSO, Elastic Net and
adaElastic Net) are used. The random forest is the non-linear approach applied. The paper predicts the IPCA from 1 to 12 months ahead and analyzes the performance of
the models by means of the root mean square error (RMSE) in comparison to the standard benchmark estimation, such as the first order autoregressive (AR) model and the random walk (RW). Analysis by the root mean square error showed that the AR
model performed best in all periods analyzed (the entire forecast window, the prepandemic and the pandemic). The random forest is the machine learning model with
the closest performance to AR, but does not outperform it. The other shrinkage models performed well below the AR benchmark. However, all models outperformed the RW
benchmark. As for the effects of the pandemic period, there is evidence that Covid-19 hurt most of the models via increased RMSE. However, it made the performance of
AR predominant over the other models. This is therefore a change in pattern since in the pre-pandemic the AR was relevant but not predominant.