doctoralThesis
Modelagem matemática para previsão de parâmetros de qualidade de água em corpos hídricos
Autor
MARQUES, Luciana Pimentel
Institución
Resumen
PACHECO FILHO, Jose Geraldo de Andrade, também é conhecido(a) em citações bibliográficas por: PACHECO, Jose Geraldo de Andrade O monitoramento da qualidade da água representa uma etapa fundamental, porém consome muito tempo e recursos e requer análise dos dados complexos com múltiplas variáveis. Neste trabalho foram investigadas técnicas de modelagem empírica baseadas em técnicas estatísticas e de inteligência artificial para inferência e previsão de parâmetros de qualidade de água. Nesse estudo foram utilizados dados de três países diferentes, provenientes de um manancial brasileiro, espanhol e chinês. Os dados temporais formam uma série com dados horários de 179 dias que foram utilizados na forma horária e de médias diárias. Inicialmente, foi realizada análise exploratória, baseada em técnicas de estatísticas multivariadas de Análise de Componentes Principais (ACP) e de Mapas Auto-organizáveis de Kohonen (SOM). Os parâmetros físico-químicos da água foram modelados para inferenciar parâmetros de qualidade, tais como clorofila, Demanda Bioquímica de Oxigênio (DBO) e cianobactérias, com base em modelos de inteligência artificial de Redes Neurais Artificiais (RNA) do tipo Perceptron Multicamadas (MLP) e Neuro-Fuzzy (NF), e modelos estatísticos do tipo Máquina de Vetores de Suporte (SVM). Em seguida os dados na forma de série temporal do manancial brasileiro foram utilizados numa modelagem para previsão futura em curto período de tempo da concentração de clorofila, com base nos modelos citados assim como as suas conjunções com a Transformada Wavelet (WT). Observou-se através das ACPs que a degradação da qualidade da água do Brasil, China e Espanha foi atribuída à poluição por matéria orgânica e compostos nitrogenados, e consequentemente encontravam-se eutrofizadas, provavelmente devido aos lançamentos de efluentes domésticos nos corpos de água. Na Análise de agrupamento para os três conjuntos de dados, realizada pelas técnicas SOM e ACP, a matriz de distâncias e o mapa de características mostram que os dados de operação normal formam um agrupamento uniforme. O esquema de cores indica que existem pequenos valores de distâncias entre algumas amostras, indicando a possibilidade de uma modelagem preditiva utilizando estes dados. Na estimativa da qualidade de água através dos dados estacionários, a técnica mais eficiente para predição de clorofila foi o modelo NF (r=0,9396 e RMSE = 3,998), para a DBO foram as RNA (r = 0,9349 e RMSE = 0,6720) e para a Cianotoxina foi o SVM (r = 0,99 e RMSE =2,65). Em relação à estratégia híbrida adotada, na qual a WT foi utilizada no pré-tratamento dos dados de entrada dos modelos, foi percebida a influência positiva na previsão da série temporal do Brasil nos três modelos testados para a previsão de teor de clorofila para série diária e horária. Isoladamente, cada modelo apresentou um desempenho diferente, contudo o melhor modelo foi aquele que utilizava RNA com WT, através da Wavelet-mãe Db20, obtendo-se valores maiores de desempenho para treinamento (R²=0,99320 e RMSE=0,85026) e teste (R²=0,99135 e RMSE=2,28134). Portanto, o presente trabalho mostrou que as modelagens em técnicas estatísticas e de inteligência artificial foram eficazes na análise de dados ambientais e podem ser utilizadas para melhoria dos modelos de gestão em caracterização e monitoramento da qualidade da água. Monitoring water quality is a critical step, but it consumes a lot of time and resources and requires complex data analysis with multiple variables. This work investigated empirical modeling techniques based on statistical and artificial intelligence techniques for inference and prediction of water quality parameters. In this study we used data from three different countries, coming from a Brazilian, Spanish and Chinese source. The temporal data form a series with hourly data of 179 days that were used in hourly form and daily averages. Initially, an exploratory analysis was performed, based on multivariate statistical techniques of Principal Component Analysis (PCA) and Kohonen's Self-Organizing Maps (SOM). The physico-chemical parameters of the water were modeled for inference of quality parameters, such as chlorophyll, Biochemical Oxygen Demand (BOD) and cyanobacteria, based on Artificial Neural Networks (RNA) models of Multi-layered Perceptron (MLP) and Neuro-Fuzzy (NF), and statistical models of support vector machine (SVM). Then the data in the time series form of the Brazilian source were used in a modeling for a short time future prediction of the chlorophyll concentration, based on the cited models as well as their conjunctions with the Wavelet Transform (WT). It was observed through the ACPs that the degradation of water quality in Brazil, China and Spain was attributed to pollution by organic matter and nitrogenous compounds, and consequently they were eutrophic, probably due to the releases of domestic effluents in the bodies of water. In cluster analysis for the three datasets, performed by the SOM and ACP techniques, the distance matrix and the characteristic map show that the normal operation data form a uniform clustering. The color scheme indicates that there are small distance values between some samples, indicating the possibility of a predictive modeling using this data. The most efficient technique for predicting chlorophyll was the NF model (r = 0.9396 and RMSE = 3,998), for BOD were RNA (r = 0.9349 and RMSE = 0.6720) and for Cyanotoxin was SVM (r = 0.99 and RMSE = 2.65). In relation to the hybrid strategy adopted, in which the WT was used in the pre-treatment of the input data of the models, it was perceived the positive influence in the prediction of the Brazilian time series in the three models tested for the prediction of chlorophyll content for daily series and hourly. Each model presented a different performance, but the best model was the one that used RNA with WT through the Wavelet Db20, obtaining higher performance values for training (R² = 0.99320 and RMSE = 0.85026) and test (R 2 = 0.99135 and RMSE = 2.28134). Therefore, the present work showed that the modeling in statistical techniques and artificial intelligence were effective in the analysis of environmental data and can be used to improve management models in characterization and monitoring of water quality.