Tese
Modelos Lineares Generalizados Hierárquicos Mistos (HGLMM) ajustados via Maxima Verossimilhança Hierárquica (HIML) e HG-BLUP: otimização da análise estatística de variáveis contínuas e categóricas
Generalized Hierarchical Mixed Linear Models (HGLMM) fitted via Hierarchical Maximum Likelihood (HIML) and HG-BLUP: optimization of the statistical analysis of continuous and categorical variables
Registration in:
SILVEIRA, Lucas Souza da. Modelos Lineares Generalizados Hierárquicos Mistos (HGLMM) ajustados via Maxima Verossimilhança Hierárquica (HIML) e HG-BLUP: otimização da análise estatística de variáveis contínuas e categóricas. 2022. 88 f. Tese (Doutorado em Estatística Aplicada e Biometria) - Universidade Federal de Viçosa, Viçosa. 2022.
Author
Silveira, Lucas Souza da
Institutions
Abstract
Este trabalho teve como objetivo principal estudar e comparar os diferentes ajustes de Modelos Lineares Generalizados Hierárquicos Mistos (HGLMM), em função das diferentes classes de variáveis aleatórias (contínuas e categóricas) e de estrutura de modelos. Estudar a flexibilização proporcionada pelos HGLMM frente aos comumente utilizados Modelos Lineares Mistos (LMM) e Modelos Lineares Generalizados Mistos (GLMM). Por vez, o HGLMM é uma classe de modelos mais ampla (a qual abarca todas as demais, via convergência, e, portanto, é a melhor modelagem que pode ser feita para qualquer classe de variáveis aleatórias) que engloba a inferência bayesiana e a inferência fisheriana (verossimilhancista) por meio da utilização da Verossimilhança Hierárquica. Nessa classe é possível ter como casos particulares de ajustes tanto o Modelo Linear Misto como o Modelo Linear Misto Generalizado. A maior vantagem do HGLMM é a possibilidade de atribuir outras distribuições (além daquela atribuída aos efeitos dos erros) da família exponencial aos fatores de componentes aleatórios do modelo e, assim, flexibilizar o ajuste em diferentes variáveis, modelos e bancos de dados. Para esse estudo foram utilizados três bancos de dados reais que possuíam características de diferentes naturezas como a contínua e categórica. Os ajustes foram comparados pelos valores do Conditional Akaike Information Criterion – cAIC (seleção de modelos) e da herdabilidade (via a maximização da acurácia). A herdabilidade foi utilizada para comparar as capacidades das estimativas dos componentes de variância capturarem adequadamente a variação genética e, portanto, propiciarem elevadas acurácias seletivas. Pode-se observar que o HGLMM alternativo teve o melhor ajuste em vários cenários. Para características contínuas foi competitivo com o Modelo Linear Misto na estimativa de componentes de variância e em ajuste de acordo com os valores cAIC. Para características categóricas se sobressaiu ao GLMM em diversos cenários. Conclui-se que os HGLMM podem ser usados corriqueiramente na análise estatística, em geral, propiciando uma triagem eficiente de quais modelos usar na modelagem de cada uma das várias classes de variáveis aleatórias, quais sejam contínuas ou categóricas. Palavras-chave: Modelos Lineares Generalizados. Modelos Hierárquicos. Seleção de Modelos. Inferência Estatística. Verossimilhança Hierárquica. Quadrados mínimos iterativos ponderados. This work aimed study and compare the different fits of Hierarchical Generalized Linear Mixed Models (HGLMM), as a function of different classes of random variables (continuous and categorical) and model structure. At the same time, aimed the study of the flexibility provided by the HGLMM against the commonly used Linear Mixed Models (LMM) and Generalized Linear Mixed Models (GLMM). The HGLMM is a broader class of models (to which all others converge, and therefore the best modeling that can be done, for any class of random variables) that encompasses Bayesian inference and Fisherian inference through the use of Hierarchical Likelihood. In this class it is possible to have both the Mixed Linear Model and the Generalized Mixed Linear Model as particular cases of adjustments. The biggest advantage of HGLMM is the possibility of assigning others distributions (in addition to the one attributed to error effects) of the exponential family to the others factors of random components of the model and, thus, making the adjustment more flexible in different variables, models and databases. For this study, three real databases were used that had characteristics of different natures, such as continuous and categorical. The adjustments were compared by the values of the conditional Akaike information criterion– cAIC and the heritability (via maximizing accuracy). Heritability was used to compare the ability of the variance component estimates to adequately capture genetic variation. It can be seen that the alternative HGLMM had the best fit in various scenarios. For continuous characteristics it was competitive with the Mixed Linear Model in the estimation of variance components and in adjustment according to cAIC values. For categorical characteristics, GLMM excelled in several scenarios. It is concluded that the HGLMM can be used routinely in statistical analysis, in general, providing an efficient screening of which models to use in the modeling of each of the several classes of random variables, whether continuous and categorical. Keywords: Generalized Linear Models. Hierarchical Likelihood. Flexible Inference. Model Selection. Selective Accuracy. Heritability.