Computer intelligence in forest modeling: carbon stock and geographical species distribution

dc.contributorGomide, Lucas Rezende
dc.contributorSilva, Mayra Luiza Marques
dc.contributorTerra, Marcela de Castro Nunes Santos
dc.contributorViola, Marcelo Ribeiro
dc.contributorAcerbi Júnior, Fausto Weimar
dc.creatorCarvalho, Mônica Canaan
dc.date2019-05-07T15:40:08Z
dc.date2019-05-07T15:40:08Z
dc.date2019-05-06
dc.date2019-03-15
dc.date.accessioned2023-09-28T19:54:25Z
dc.date.available2023-09-28T19:54:25Z
dc.identifierCARVALHO, M. C. Inteligência computacional na modelagem florestal: teor de carbono e distribuição geográfica de espécies. 2019. 148 p. Tese (Doutorado em Engenharia Florestal)–Universidade Federal de Lavras, Lavras, 2019.
dc.identifierhttp://repositorio.ufla.br/jspui/handle/1/34041
dc.identifier.urihttps://repositorioslatinoamericanos.uchile.cl/handle/2250/9039819
dc.descriptionForest modeling, whether for its dendrometric variables or geographical distribution, is a consolidated practice in Forest Engineering in which traditional statistical models are typically employed. However, the progress made by computer science in recent decades has made new challenges and solutions possible, which may limit the use of traditional statistical models. Machine learning algorithms gain their use in the forestry sector within the context of little-known non-linear relations derived from large databases. Among these algorithms, the random forest (RF) is prominent due to its robustness, ease of parameterization, and internal metrics. Despite its great potential, this algorithm demands further studies to consolidate its use. In this dissertation, we applied the algorithm in three different situations for native forests, addressing classification and regression issues, as well as heterogeneous data from different sources. The first article (1) aimed to evaluate three machine learning methods (decision tree - J48, RF, and artificial neural networks) for the potential distribution modeling of the ten most abundant tree species in a subbasin of the Sao Francisco River, in Minas Gerais, Brazil. In conclusion, the RF algorithm presented the most robust tree species potential distribution model. With the results obtained by the algorithm, we wrote the second article (2) seeking to model the potential distribution of Eremanthus erythropappus, considering climatic change scenarios. The hypothesis tested is associated with future effects (2050 and 2070) on the ecological niche of the species. The results indicate a good accuracy of the method used, highlighting the Espinhaço, Canastra, and Mantiqueira mountain ranges as the three primary ecological refuges of the species. We verified a drastic reduction in the potential area of species development regarding its interaction with the local climate if the climate changes scenarios be come real. The last article (3) focused on the application of RF on regression problems involving the prediction of the quantitative variable of carbon content above the soil. The objective was to test the combination of methods and strategies in the selection of variables using the random forest. The results obtained indicate that the RF algorithm is a robust method, little affected by the inclusion of many correlated variables. Even with the slight improvement in algorithm errors, the use of variable selection techniques is justified since it considerably reduces the number of variables used. The multi-objective genetic algorithm obtained a smaller set of selected data and lower error. Given the results found, the RF has great potential to explore relationships still little known in Forest Engineering, whether they are classification or regression issues.
dc.descriptionCoordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)
dc.descriptionA modelagem de florestas, seja de suas variáveis dendrométricas ou de sua distribuição geográfica, é uma prática consolidada na Engenharia Florestal, na qual tradicionalmente são empregados modelos da estatística clássica. Entretanto, o progresso obtido pela ciência da computação nas últimas décadas tem possibilitado novos desafios e soluções, os quais podem limitar a utilização dos modelos estatísticos tradicionais. É no contexto de relações não-lineares pouco conhecidas que os algoritmos de aprendizagem de máquina ganham sua utilidade no setor florestal. Dentre esses algoritmos, recebe destaque o random forest (RF), por sua robustez, facilidade de parametrização e métricas internas. Apesar do grande potencial deste algoritmo, o mesmo carece de mais estudos para consolidar o uso da técnica. Nessa tese, o algoritmo foi aplicado em três situações diferentes para florestas nativas, abordando problemas de classificação e regressão, além de dados heterogêneos oriúndos de diversas fontes. O primeiro artigo (1) teve como objetivo avaliar três métodos de aprendizagem de máquina (árvore de decisão - J48, RF e redes neurais artificias), na modelagem da distribuição potencial de dez espécies arbóreas mais abundantes em uma subbacia do rio São Francisco, em Minas Gerais. Conclui-se que o algoritmo RF apresentou-se como o mais robusto para a modelagem da distribuição potencial de espécies arbóreas. Diante destes resultados obtidos pelo algoritmo, no segundo artigo (2) procurou-se modelar a distribuição potencial de Eremanthus erythropappus, considerando cenários de mudanças climáticas. A hipótese testada está associada aos efeitos no nicho ecológico da espécie no futuro (2050 e 2070). Os resultados indicam uma boa acurácia do método empregado, destacando as cadeias montanhosas do Espinhaço, Canastra e Mantiqueira como os três principais refúgios ecológicos da espécie. Constatou-se, caso confirmado os cenários de mudanças no clima, uma redução drástica na área potencial de desenvolvimento da espécie, no que tange sua interação com o clima local. O último artigo (3) concentrou-se na aplicação do RF para problemas de regressão, envolvendo a predição da variável quantitativa teor de Carbono acima do solo. O objetivo foi testar a combinação de métodos e estratégias na seleção de variáveis, empregando o RF. Os resultados alcançados indicam o algoritmo RF como um método robusto, pouco afetado pela inclusão de um grande número de variáveis correlacionadas. Mesmo com a pequena melhora nos erros do algoritmo, o uso das técnicas de seleção de variáveis se justifica visto que diminui consideravelmente o número de variáveis utilizadas. O algoritmo genético multiobjetivo obteve menor conjunto de dados selecionados bem como menor erro. Perante os resultados encontrados, atribui-se ao RF grande potencial para explorar relações ainda pouco conhecidas na Engenharia Florestal, sejam estas relações problemas classificatórios ou de regressão.
dc.formatapplication/pdf
dc.languagepor
dc.publisherUniversidade Federal de Lavras
dc.publisherPrograma de Pós-graduação em Engenharia Florestal
dc.publisherUFLA
dc.publisherbrasil
dc.publisherDepartamento de Ciências Florestais
dc.rightsrestrictAccess
dc.subjectAprendizagem de máquina
dc.subjectFloresta aleatória
dc.subjectFloresta nativa
dc.subjectMachine learning
dc.subjectRandom forest
dc.subjectNative forest
dc.subjectManejo Florestal
dc.titleInteligência computacional na modelagem florestal: teor de carbono e distribuição geográfica de espécies
dc.titleComputer intelligence in forest modeling: carbon stock and geographical species distribution
dc.typetese


Este ítem pertenece a la siguiente institución