Tese
Ferramentas computacionais para suporte a decisão no mapeamento de atributos do solo
Computational tools for decision making in soil attributes mapping
Registro en:
PEREIRA, Gustavo Willam. Ferramentas computacionais para suporte a decisão no mapeamento de atributos do solo. 2021. 108 f. Tese (Doutorado em Engenharia Agrícola) - Universidade Federal de Viçosa, Viçosa. 2021.
Autor
Pereira, Gustavo Willam
Institución
Resumen
A agricultura de precisão (AP) é uma técnica de gestão agrícola baseada na observação, medição e resposta às variabilidades espaciais e temporais que ocorrem nas áreas de produção agrícola e de pastagens. A sua adoção pode ser feita por meio de sistemas de apoio à decisão que tem por objetivo maximizar os lucros e aumentar a eficiência no uso de insumos. Em AP, o mapeamento das características físicas e químicas do solo permite estimar com maior precisão a variabilidade espacial do solo. O desenvolvimento de sistemas de informação geográfica (SIG) e sua utilização têm aumentado consideravelmente nos últimos anos, sendo, portanto, utilizado em larga escala na AP. Dado um conjunto de pontos amostrados deseja-se obter mapas dos atributos de solo ou inferir valores em lugares específicos em locais não amostrados, para isso técnicas de interpolação são utilizadas. Existem diversos métodos interpoladores, sendo a Krigagem Ordinária (OK) um dos mais usados. Entretanto, desde o início do século XXI tem havido um interesse crescente em utilizar algoritmos baseados em dados para a geração dos mapas. Estes algoritmos são conhecidos sob o nome “Machine Learning” e têm-se mostrados eficientes para produzir previsões espaciais. As técnicas de amostragem de solo e a densidade de amostragem são fatores determinantes para a geração de mapas interpolados dos atributos de solo. Entretanto o custo de análise para uma amostragem convencional mais densa do solo torna-se muitas vezes inviável o processo. Sendo assim técnicas alternativas que apresentem menores custos para amostragem de atributos do solo devem ser implementadas. Assim o presente trabalho tem como objetivo desenvolver um software de suporte a tomada de decisão em AP e analisar diferentes estratégias de amostragem para caracterização da variabilidade espacial dos atributos físicos e químicos do solo. O software desenvolvido consistiu de um plugin (complemento) para o QGIS (programa de computador livre e de código aberto para SIG) para a interpolação de atributos do solo por meio do método da Krigagem Ordinária e da técnica de aprendizado de Máquina “Support Vector Machine” (SVM). Para isso linguagens de programação como Python e ferramentas de código aberto do QGIS foram utilizadas, dispensado a aquisição de licenças. O método SVM foi implementado de tal forma que covariáveis pudessem ser adicionadas ao modelo. Isso possibilitou que variáveis obtidas de forma mais adensada em campo pudessem ser adicionadas na geração dos mapas de atributos do solo. O interpolador Inverso da Distância Ponderada (IDW) foi utilizado para ajustar o número de observações das layers em formato shape e/ou raster do QGIS ao número de observações da tabela de atributos para a geração dos mapas. O plugin foi desenvolvido de forma a permitir que a própria variável fosse adicionada como covariável ao modelo SVM por meio do interpolador IDW. Em três estudos de caso a técnica SVM apresentou um desempenho superior ao método OK com maiores valores de Rº e menores valores de RMSE. As três áreas de estudo foram amostradas utilizando-se diferentes densidades amostrais. O Índice de Moran foi utilizado para medir a correlação espacial entre os pontos amostrados. No primeiro estudo de caso, em uma área de 20,2 ha com 141 pontos amostrados, o método OK apresentou valores de Rº superior em três dos dez atributos de solo analisados. O Índice de Moran para estes três atributos apresentaram valores superiores a 0,/2 e significativos ao nível de 5% de probabilidade medido pelo seu p-valor. No segundo estudo de caso, realizado em uma área de 204 ha com 204 pontos amostrados, OK foi superior para cinco atributos em dez analisados, com Índice de Moran variando entre 0,71 e 0,84, todos significativos. Para estes dois estudos de caso o método SVM foi utilizado tendo apenas a própria variável interpolada pelo método IDW como covariável. Já no terceiro estudo de caso, em uma área de 90 ha com 181 pontos coletados, foram utilizadas no método SVM, além da própria covariável, outras covariáveis de fácil aquisição como condutividade elétrica aparente (ECa) do solo ou atributos que se modificam pouco ao longo do tempo como altitude, matéria orgânica, silte, argila e areia. Neste terceiro estudo de caso as amostras foram divididas em dois conjuntos de treinamento e teste. Para o conjunto de treinamento o método SVM com utilização de covariáveis foi superior ao OK para todas as variáveis analisadas em três densidades de grids amostrais. Palavras-chave: Sistemas de informações geográficas. Krigagem ordinária. Aprendizado de máquina. Amostragem de solo. Variabilidade espacial. Precision agriculture (PA) is an agricultural management technique based on observation, measurement and response to spatial and temporal variations that occur in agricultural production and pasture areas. Its adoption can be done through decision support systems that aim to maximize profits and increase efficiency in the use of inputs. In AP, the mapping of the physical and chemical characteristics of the soil allows for a more accurate estimation of the spatial variability of the soil. The development of geographic information systems (GIS) and their use have increased considerably in recent years, and are therefore used on a large scale in PA. Given a set of sampled points, it is desired to obtain maps of soil attributes or infer values in specific places in non-sampled locations, for that interpolation techniques are used. There are several interpolating methods, being the Ordinary Kriging (OK) one of the most used. However, since the beginning of the 21st century, there has been a growing interest in using data-based algorithms to generate maps. These algorithms are known under the name “Machine Learning” and have been shown to be efficient in producing spatial predictions. Soil sampling techniques and sampling density are determining factors for the generation of interpolated maps of soil attributes. However, the cost of analysis for a denser conventional sampling of the soil often makes the process unfeasible. Therefore, alternative techniques that present lower costs for sampling soil attributes must be implemented. Thus, this work aims to develop a software to support decision making in PA and analyze different sampling strategies to characterize the spatial variability of physical and chemical soil attributes. The developed software consisted of a plugin (complement) for QGIS (free and open source computer program for GlIS) for the interpolation of soil attributes through the Ordinary Kriging method and the Machine learning technique “Support Vector Machine” (SVM). For this, programming languages such as Python and QGIS's open source tools were used, with no need to purchase licenses. The SVM method was implemented in such a way that covariates could be added to the model. This made it possible for variables obtained in a more dense way in the field to be added in the generation of maps of soil attributes. The Inverse Weighted Distance Interpolator (IDWV) was used to adjust the number of observations of layers in shape and/or raster format from QGIS to the number of observations in the attribute table for the generation of maps. The plugin was developed in order to allow the variable itself to be added as a covariate to the SVM model through the IDW interpolator. In three case studies, the SVM technique performed better than the OK method with higher values of R2 and lower values of RMSE. The three study areas were sampled using different sample densities. The Moran Index was used to measure the spatial correlation between the sampled points. In the first case study, in an area of 20.2 ha with 141 sampled points, the OK method presented higher R2 values in three of the ten soil attributes analyzed. The Moran Index for these three attributes showed values above 0.72 and significant at the 5% probability level measured by its p-value. In the second case study, carried out in an area of 204 ha with 204 sampled points, OK was superior for five in ten analyzed, with Moran's Index varying between 0.71 and 0.84, all significant. For these two case studies, the SVM method was used with only the variable interpolated by the IDW method as a covariate. In the third case study, in an area of 90 ha with 181 collected points, in addition to the covariate itself, other easily acquired covariates were used in the SVM method, such as apparent electrical conductivity (ECa) of the soil or attributes that change little when over time as altitude, organic matter, silt, clay and sand. In this third case study the samples were divided into two sets of training and testing. For the training set, the SVM method using covariates was superior to OK for all variables analyzed in three sample grid densities.