Tese
Modelos GGE: estimadores de encolhimento e heterocedasticidade
GGE models: shrinkage estimators and heteroscedasticity;
GGE: estimadores de contracción y heterocedasticidad
Registration in:
OLIVEIRA, Luciano Antonio de. Modelos GGE: estimadores de encolhimento e heterocedasticidade. 2021. 173 p. Tese (Doutorado em Estatística e Experimentação Agropecuária) - Departamento de Estatística, Universidade Federal de Lavras, MG, 2021.
Author
Oliveira, Luciano Antonio de
Institutions
Abstract
Multiplicative (or linear-bilinear) models are useful in different areas of knowledge to analyze
data in two-way tables in which both factors and their interaction are studied. This is particularly
important in the final stages of plant breeding programs, where several genotypes are evaluated
in different environments and the interaction between genotypes environments (GEI) generally
makes it difficult to select and widely recommend cultivars. Among these models, the
Main Effects of Genotypes (G) plus GEI, referred to in the literature as GGE or SERG (Sites
“environments” Regression Model) has wide applicability by researchers and breeders in the
analysis of data resulting from multi-environmental experiments (MET). Of main relevance is
its graphical interpretation that considers only the first two main components called GGE biplot.
Many authors have pointed out the advantages of applying Bayesian inference in these models,
avoiding standard analysis which considers the parameters to be fixed effects. Shrinking estimates
of the parameters that model the GEI and the heterogeneity of variances between locations
were modeled directly under the Bayesian methodology for the AMMI model (Additive Main
Effects and Multiplicative Interaction), another model belonging to the general class of multiplicative
models and provided flexibility in the analysis of MET data. The main objective of this
thesis was to extend the Bayesian version of the GGE model in two directions: a) to study maximum
entropy principle to derive objective a priori distributions to G + GEI effects and b) to
implement the heteroscedastic version. These proposals were exemplified with both simulated
and actual data. We showed that maximum entropy prior distributions for variance components
of singular values makes the GGE model more flexible. Furthermore, considering the specific
variance in each location, a better fit of the model is obtained, allowing, on the other hand, to
evaluate the genotypes with different precision, retrieving experimental information present in
different tests from the biplot graphical representation. The versatility of Bayesian modeling
to incorporate inference to the biplot was also shown, with many aspects such as credibility regions
for medium environment and ideal genotype, correlations between environments and for
the representation “who won where”, that are all difficult to obtain in the standard biplot analysis.
In this sense, the method presented here looks quite promising and his implementation on
statistical packages suitable for researchers is a work in progress. Modelos multiplicativos (ou lineares-bilineares) são úteis em distintas áreas do conhecimento
para analisar dados organizados em tabelas de dupla entrada com dois fatores e sua interação
sendo estudados. Isso é particularmente importante nas fases finais de programas de melhoramento
de plantas, em que, via de regra, vários genótipos são avaliados em diferentes ambientes
e a interação genótipos ambientes (GEI), geralmente, dificulta a seleção e recomendação ampla
de cultivares superiores. Dentre esses modelos, o de efeitos principais de genótipos (G)
mais GEI, referido na literatura como GGE ou SERG (Sites “environments” Regression Model)
merece especial destaque devido à ampla aplicabilidade por pesquisadores e melhoristas na
análise de dados resultantes de experimentos multiambientais (MET), especialmente a sua interpretação
gráfica que considera apenas os dois primeiros componentes principais denominada
GGE biplot. Muitos autores têm apontado as vantagens obtidas pela aplicação da inferência
bayesiana nestes modelos em substituição à analise padrão, ou clássica, que considera os parâmetros
como sendo de efeitos fixos (frequentista). Tanto o encolhimento de estimativas dos
parâmetros que modelam a GEI quanto modelos que contemplam a heterogeneidade de variâncias
entre locais foram tratados diretamente sob a metodologia bayesiana para o modelo AMMI
(Additive Main Effects and Multiplicative Interaction), mas ainda não foram discutidos para
modelos GGE. O principal objetivo desta tese foi estender a versão bayesiana do modelo GGE
em dois sentidos: a) estudar distribuições a priori de máxima entropia para o encolhimento dos
efeitos G+GEI e b) implementar a versão heterocedástica. Essas propostas foram verificadas
em cenários simulados e exemplificadas com dados reais. Os resultados mostraram que a inferência
bayesiana, com distribuições a priori de máxima entropia para componentes de variância
dos valores singulares, flexibiliza o modelo GGE. Além disso, considerando variância especifica
em cada local obtem-se um melhor ajuste do modelo, permitindo, por outro lado, avaliar
os genótipos com diferentes precisões, recuperando informações experimentais presentes em
diferentes ensaios a partir da representação gráfica biplot. Ficou também evidenciada a versatilidade
da modelagem bayesiana para incorporar inferência ao biplot (atribuindo regiões de
credibilidade para ambiente médio, genótipo ideal, correlações entre ambientes e resumos do
tipo “quem venceu onde”) difíceis de serem obtidas nas análises biplot usuais do modelo GGE.
Os métodos aqui discutidos são bastante promissores e estão sendo implementados programas
para disponibilizá-los aos pesquisadores.