Tese
Modelos de aprendizado de máquinas híbridos aplicados à previsão de curto prazo da vazão do Rio Zambeze afluente à barragem hidroelétrica de Cahora-Bassa, em Moçambique
Autor
Martinho, Alfeu Dias
Institución
Resumen
Rivers are still one of the greatest and most important resources for the survival
of humanity. They provide much of the water we consume and that we use to produce
our food and for our hygiene. In addition, we use it to irrigate the soil in agricultural
areas, for navigation, fishing, electricity production, in addition to maintaining biodiversity.
Due to water scarcity and concern about its existence in the future, it becomes essential
to develop studies that can help to understand its dynamics, in order to manage it.
The Zambezi River is the fourth largest watercourse on the African continent and is
of vital importance in the region, as it is the main source of electricity production in
Mozambique, contributes to the development of the economy of the delta through the
viability of economic activities such as agriculture, pastoralism, fishing, construction of
access roads and, in reducing the risk of occurrence of natural disasters, such as drought
and floods. Despite this need, studies of water resources for this region are still scarce. The
present work presents the development of hybrid machine learning models for predicting
natural flows of water bodies of the Zambezi River at the Cahora-Bassa Hydroelectric
dam, using antecedent values of influent flows, precipitation, evaporation and relative
humidity as input variables. Five models were considered in the analysis: Extreme
Gradient Boosting (XGB), Extreme Learning Machine (ELM), Support Vector Regression
(SVR), Elastic Net linear (EN) and Multivariate Adaptive Regression Splines (MARS) .
Evolutionary/bioinspired optimization algorithms: Grey wolf optimization (GWO), Genetic
Algorithms (GA), Differential Evolution (DE) and Particle Swarm Optimization (PSO)
were used as selection strategies for all parameters internals of the models. And, in addition
to evaluating the potential of the five hybrid machine learning models for flow simulation,
this work also focused on two input variable selection methods, Least Absolute Shrinkage
and Selection Operator (LASSO) and Partial Mutual Information variable selection (PMI),
used to choose the subset that allows the best prediction of future values, and that provide
comprehensive information about the influence of variables on the simulated flow. The
developed hybrid models performed predictions for 1, 3, 5 and 7 days ahead on data
collected at the Cahora-Bassa Hydroelectric dam in Mozambique. Combined performance
measures and statistical tests were applied to evaluate the performance of the models.
Uncertainty analysis techniques based on confidence intervals and Montecarlo simulation
were also used to analyze the reliability of forecasts provided by the models. The results
show that all models performed well to predict river discharge several steps ahead, indicating
that the integration of evolutionary/bioinspired algorithms is a successful alternative to
produce accurate discharge predictions. The hybrid model XGB with integrated GWO
and its respective variations with selection of input variables, XGB-LASSO and XGB-PMI
outperformed the hybrid models EN, ELM, MARS and SVR, having presented the best
performance, respectively, for 1, 3, 5, and 7 steps ahead. These models provide reliable
forecasts, and can be used as an alternative to aid in flow forecasting, which is crucial for
sustainable or optimized management and planning of water resources in hydroelectric
power plants. Os Rios são até hoje um dos maiores e mais importantes recursos para a sobrevivência da humanidade. Eles fornecem grande parte da água que consumimos e que usamos
para produzir nossos alimentos e para nossa higiene. Além disso, a utilizamos para irrigar
o solo das áreas agrícolas, para navegação, pesca, produção de energia elétrica, para além
da manutenção da biodiversidade. Devido à escassez da água e da preocupação com a
sua existência no futuro, torna-se indispensável o desenvolvimento de estudos que possam
ajudar a compreender sua dinâmica, de modo a gerenciá-la. O rio Zambeze é o quarto
maior curso de água do continente africano e tem vital importância, porque é a principal
fonte de produção de energia elétrica de Moçambique, contribui para o desenvolvimento
da economia do delta através da viabilização de atividades econômicas como agricultura,
pastorícia, pesca, construção de vias de acesso e, na redução do risco de ocorrência de calamidades naturais, como a seca, cheias ou inundações. Apesar dessa necessidade, os estudos
de recursos hídricos para essa região ainda são escassos. O presente trabalho apresenta o
desenvolvimento de modelos híbridos de aprendizado de máquina para previsão de vazões
naturais de corpos d’água do rio Zambéze na barragem Hidrelétrica de Cahora-Bassa,
utilizando valores antecedentes de vazões afluentes, precipitação, evaporação e umidade
relativa como variáveis de entrada. Cinco modelos foram considerados na análise: Extreme
Gradient Boosting (XGB), Extreme Learning Machine (ELM), Support Vector Regression
(SVR), Elastic Net linear (EN) e Multivariate Adaptive Regression Splines (MARS). Algoritmos de otimização evolutivos/bioinspirados: Grey wolf optimization (GWO), Genetic
Algorithms (GA), Differential Evolution (DE) e Particle Swarm Optimization (PSO)
foram utilizados como estratégias de seleção de todos os parâmetros internos dos modelos.
E, além de avaliar o potencial dos cinco modelos de aprendizado de máquinas híbridos
para simulação de fluxo, este trabalho também focou em dois métodos de seleção de
variáveis de entradas, Least Absolute Shrinkage and Selection Operator (LASSO) e Partial
Mutual Information variable selection (PMI), usados para escolher o subconjunto que
permite a melhor previsão dos valores futuros, e que fornecem informações abrangentes
sobre a influência das variáveis no fluxo simulado. Os modelos híbridos desenvolvidos
realizaram as previsões para 1, 3, 5 e 7 dias à frente em dados coletados na barragem
Hidroelétrica de Cahora-Bassa , em Moçambique. Medidas de desempenho combinadas e
testes estatísticos foram aplicados para avaliação da performance dos modelos. Técnicas
de análise de incerteza baseadas em intervalos de confiança e simulação de Montecarlo
também foram utilizadas para a análise de confiabilidade das previsões fornecidas pelos
modelos. Os resultados mostram que todos os modelos obtiveram bons desempenhos para
prever a vazão do rio vários passos à frente, indicando que a integração dos algoritmos
evolutivos/bioinspirados é uma alternativa bem-sucedida para produzir previsões precisas
da vazão. O modelo híbrido XGB com GWO integrado e suas respectivas variações com
seleção de variáveis de entrada, XGB-LASSO e XGB-PMI superaram os modelos híbridos
EN, ELM, MARS e SVR, tendo apresentado a melhor performance, para 1, 3, 5 e 7 passos
à frente. Esses modelos fornecem previsões confiáveis, e podem ser utilizados como uma
alternativa para auxiliar na previsão de vazão, que é crucial para as atividades de gestão e
planejamento sustentável ou otimizado de Recursos Hídricos em usinas hidroelétricas.