Inteligência computacional na modelagem florestal: teor de carbono e distribuição geográfica de espécies

Carvalho, Mônica Canaan

Computer intelligence in forest modeling: carbon stock and geographical species distribution

dc.contributor	Gomide, Lucas Rezende
dc.contributor	Silva, Mayra Luiza Marques
dc.contributor	Terra, Marcela de Castro Nunes Santos
dc.contributor	Viola, Marcelo Ribeiro
dc.contributor	Acerbi Júnior, Fausto Weimar
dc.creator	Carvalho, Mônica Canaan
dc.date	2019-05-07T15:40:08Z
dc.date	2019-05-07T15:40:08Z
dc.date	2019-05-06
dc.date	2019-03-15
dc.date.accessioned	2023-09-28T19:54:25Z
dc.date.available	2023-09-28T19:54:25Z
dc.identifier	CARVALHO, M. C. Inteligência computacional na modelagem florestal: teor de carbono e distribuição geográfica de espécies. 2019. 148 p. Tese (Doutorado em Engenharia Florestal)–Universidade Federal de Lavras, Lavras, 2019.
dc.identifier	http://repositorio.ufla.br/jspui/handle/1/34041
dc.identifier.uri	https://repositorioslatinoamericanos.uchile.cl/handle/2250/9039819
dc.description	Forest modeling, whether for its dendrometric variables or geographical distribution, is a consolidated practice in Forest Engineering in which traditional statistical models are typically employed. However, the progress made by computer science in recent decades has made new challenges and solutions possible, which may limit the use of traditional statistical models. Machine learning algorithms gain their use in the forestry sector within the context of little-known non-linear relations derived from large databases. Among these algorithms, the random forest (RF) is prominent due to its robustness, ease of parameterization, and internal metrics. Despite its great potential, this algorithm demands further studies to consolidate its use. In this dissertation, we applied the algorithm in three different situations for native forests, addressing classification and regression issues, as well as heterogeneous data from different sources. The first article (1) aimed to evaluate three machine learning methods (decision tree - J48, RF, and artificial neural networks) for the potential distribution modeling of the ten most abundant tree species in a subbasin of the Sao Francisco River, in Minas Gerais, Brazil. In conclusion, the RF algorithm presented the most robust tree species potential distribution model. With the results obtained by the algorithm, we wrote the second article (2) seeking to model the potential distribution of Eremanthus erythropappus, considering climatic change scenarios. The hypothesis tested is associated with future effects (2050 and 2070) on the ecological niche of the species. The results indicate a good accuracy of the method used, highlighting the Espinhaço, Canastra, and Mantiqueira mountain ranges as the three primary ecological refuges of the species. We verified a drastic reduction in the potential area of species development regarding its interaction with the local climate if the climate changes scenarios be come real. The last article (3) focused on the application of RF on regression problems involving the prediction of the quantitative variable of carbon content above the soil. The objective was to test the combination of methods and strategies in the selection of variables using the random forest. The results obtained indicate that the RF algorithm is a robust method, little affected by the inclusion of many correlated variables. Even with the slight improvement in algorithm errors, the use of variable selection techniques is justified since it considerably reduces the number of variables used. The multi-objective genetic algorithm obtained a smaller set of selected data and lower error. Given the results found, the RF has great potential to explore relationships still little known in Forest Engineering, whether they are classification or regression issues.
dc.description	Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)
dc.description	A modelagem de florestas, seja de suas variáveis dendrométricas ou de sua distribuição geográfica, é uma prática consolidada na Engenharia Florestal, na qual tradicionalmente são empregados modelos da estatística clássica. Entretanto, o progresso obtido pela ciência da computação nas últimas décadas tem possibilitado novos desafios e soluções, os quais podem limitar a utilização dos modelos estatísticos tradicionais. É no contexto de relações não-lineares pouco conhecidas que os algoritmos de aprendizagem de máquina ganham sua utilidade no setor florestal. Dentre esses algoritmos, recebe destaque o random forest (RF), por sua robustez, facilidade de parametrização e métricas internas. Apesar do grande potencial deste algoritmo, o mesmo carece de mais estudos para consolidar o uso da técnica. Nessa tese, o algoritmo foi aplicado em três situações diferentes para florestas nativas, abordando problemas de classificação e regressão, além de dados heterogêneos oriúndos de diversas fontes. O primeiro artigo (1) teve como objetivo avaliar três métodos de aprendizagem de máquina (árvore de decisão - J48, RF e redes neurais artificias), na modelagem da distribuição potencial de dez espécies arbóreas mais abundantes em uma subbacia do rio São Francisco, em Minas Gerais. Conclui-se que o algoritmo RF apresentou-se como o mais robusto para a modelagem da distribuição potencial de espécies arbóreas. Diante destes resultados obtidos pelo algoritmo, no segundo artigo (2) procurou-se modelar a distribuição potencial de Eremanthus erythropappus, considerando cenários de mudanças climáticas. A hipótese testada está associada aos efeitos no nicho ecológico da espécie no futuro (2050 e 2070). Os resultados indicam uma boa acurácia do método empregado, destacando as cadeias montanhosas do Espinhaço, Canastra e Mantiqueira como os três principais refúgios ecológicos da espécie. Constatou-se, caso confirmado os cenários de mudanças no clima, uma redução drástica na área potencial de desenvolvimento da espécie, no que tange sua interação com o clima local. O último artigo (3) concentrou-se na aplicação do RF para problemas de regressão, envolvendo a predição da variável quantitativa teor de Carbono acima do solo. O objetivo foi testar a combinação de métodos e estratégias na seleção de variáveis, empregando o RF. Os resultados alcançados indicam o algoritmo RF como um método robusto, pouco afetado pela inclusão de um grande número de variáveis correlacionadas. Mesmo com a pequena melhora nos erros do algoritmo, o uso das técnicas de seleção de variáveis se justifica visto que diminui consideravelmente o número de variáveis utilizadas. O algoritmo genético multiobjetivo obteve menor conjunto de dados selecionados bem como menor erro. Perante os resultados encontrados, atribui-se ao RF grande potencial para explorar relações ainda pouco conhecidas na Engenharia Florestal, sejam estas relações problemas classificatórios ou de regressão.
dc.format	application/pdf
dc.language	por
dc.publisher	Universidade Federal de Lavras
dc.publisher	Programa de Pós-graduação em Engenharia Florestal
dc.publisher	UFLA
dc.publisher	brasil
dc.publisher	Departamento de Ciências Florestais
dc.rights	restrictAccess
dc.subject	Aprendizagem de máquina
dc.subject	Floresta aleatória
dc.subject	Floresta nativa
dc.subject	Machine learning
dc.subject	Random forest
dc.subject	Native forest
dc.subject	Manejo Florestal
dc.title	Inteligência computacional na modelagem florestal: teor de carbono e distribuição geográfica de espécies
dc.title	Computer intelligence in forest modeling: carbon stock and geographical species distribution
dc.type	tese

Este ítem pertenece a la siguiente institución

Universidade Federal de Lavras (Brasil)