tese
Inteligência computacional na modelagem florestal: teor de carbono e distribuição geográfica de espécies
Computer intelligence in forest modeling: carbon stock and geographical species distribution
Registro en:
CARVALHO, M. C. Inteligência computacional na modelagem florestal: teor de carbono e distribuição geográfica de espécies. 2019. 148 p. Tese (Doutorado em Engenharia Florestal)–Universidade Federal de Lavras, Lavras, 2019.
Autor
Carvalho, Mônica Canaan
Institución
Resumen
Forest modeling, whether for its dendrometric variables or geographical
distribution, is a consolidated practice in Forest Engineering in which traditional
statistical models are typically employed. However, the progress made by
computer science in recent decades has made new challenges and solutions
possible, which may limit the use of traditional statistical models. Machine
learning algorithms gain their use in the forestry sector within the context of
little-known non-linear relations derived from large databases. Among these
algorithms, the random forest (RF) is prominent due to its robustness, ease of
parameterization, and internal metrics. Despite its great potential, this algorithm
demands further studies to consolidate its use. In this dissertation, we applied the
algorithm in three different situations for native forests, addressing classification
and regression issues, as well as heterogeneous data from different sources. The
first article (1) aimed to evaluate three machine learning methods (decision tree -
J48, RF, and artificial neural networks) for the potential distribution modeling of
the ten most abundant tree species in a subbasin of the Sao Francisco River, in
Minas Gerais, Brazil. In conclusion, the RF algorithm presented the most robust
tree species potential distribution model. With the results obtained by the
algorithm, we wrote the second article (2) seeking to model the potential
distribution of Eremanthus erythropappus, considering climatic change
scenarios. The hypothesis tested is associated with future effects (2050 and
2070) on the ecological niche of the species. The results indicate a good
accuracy of the method used, highlighting the Espinhaço, Canastra, and
Mantiqueira mountain ranges as the three primary ecological refuges of the
species. We verified a drastic reduction in the potential area of species
development regarding its interaction with the local climate if the climate
changes scenarios be come real. The last article (3) focused on the application of
RF on regression problems involving the prediction of the quantitative variable
of carbon content above the soil. The objective was to test the combination of
methods and strategies in the selection of variables using the random forest. The
results obtained indicate that the RF algorithm is a robust method, little affected
by the inclusion of many correlated variables. Even with the slight improvement
in algorithm errors, the use of variable selection techniques is justified since it
considerably reduces the number of variables used. The multi-objective genetic
algorithm obtained a smaller set of selected data and lower error. Given the
results found, the RF has great potential to explore relationships still little known
in Forest Engineering, whether they are classification or regression issues. Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) A modelagem de florestas, seja de suas variáveis dendrométricas ou de sua
distribuição geográfica, é uma prática consolidada na Engenharia Florestal, na
qual tradicionalmente são empregados modelos da estatística clássica.
Entretanto, o progresso obtido pela ciência da computação nas últimas décadas
tem possibilitado novos desafios e soluções, os quais podem limitar a utilização
dos modelos estatísticos tradicionais. É no contexto de relações não-lineares
pouco conhecidas que os algoritmos de aprendizagem de máquina ganham sua
utilidade no setor florestal. Dentre esses algoritmos, recebe destaque o random
forest (RF), por sua robustez, facilidade de parametrização e métricas internas.
Apesar do grande potencial deste algoritmo, o mesmo carece de mais estudos
para consolidar o uso da técnica. Nessa tese, o algoritmo foi aplicado em três
situações diferentes para florestas nativas, abordando problemas de classificação
e regressão, além de dados heterogêneos oriúndos de diversas fontes. O primeiro
artigo (1) teve como objetivo avaliar três métodos de aprendizagem de máquina
(árvore de decisão - J48, RF e redes neurais artificias), na modelagem da
distribuição potencial de dez espécies arbóreas mais abundantes em uma subbacia do rio São Francisco, em Minas Gerais. Conclui-se que o algoritmo RF
apresentou-se como o mais robusto para a modelagem da distribuição potencial
de espécies arbóreas. Diante destes resultados obtidos pelo algoritmo, no
segundo artigo (2) procurou-se modelar a distribuição potencial de Eremanthus
erythropappus, considerando cenários de mudanças climáticas. A hipótese
testada está associada aos efeitos no nicho ecológico da espécie no futuro (2050
e 2070). Os resultados indicam uma boa acurácia do método empregado,
destacando as cadeias montanhosas do Espinhaço, Canastra e Mantiqueira como
os três principais refúgios ecológicos da espécie. Constatou-se, caso confirmado
os cenários de mudanças no clima, uma redução drástica na área potencial de
desenvolvimento da espécie, no que tange sua interação com o clima local. O
último artigo (3) concentrou-se na aplicação do RF para problemas de regressão,
envolvendo a predição da variável quantitativa teor de Carbono acima do solo. O
objetivo foi testar a combinação de métodos e estratégias na seleção de
variáveis, empregando o RF. Os resultados alcançados indicam o algoritmo RF
como um método robusto, pouco afetado pela inclusão de um grande número de
variáveis correlacionadas. Mesmo com a pequena melhora nos erros do
algoritmo, o uso das técnicas de seleção de variáveis se justifica visto que
diminui consideravelmente o número de variáveis utilizadas. O algoritmo
genético multiobjetivo obteve menor conjunto de dados selecionados bem como
menor erro. Perante os resultados encontrados, atribui-se ao RF grande potencial
para explorar relações ainda pouco conhecidas na Engenharia Florestal, sejam
estas relações problemas classificatórios ou de regressão.