Dissertação
Modelos de regressão para dados censurados sob a classe de distribuições de misturas de escala normal assimétricas
Autor
Guzman, Daniel Camilo Fuentes
Institución
Resumen
A frequent problem in regression analysis is when the observation of the response
variable is censored for some subjects. This occurs in several practical situations, for
reasons such as limitations of the measuring equipment or the experimental design.
These phenomena can be modeled using statistical and mathematical models. In the
framework of censored regression models the random errors are routinely assumed
to have a normal distribution, mainly for mathematical convenience. However, this
method has been criticized in the literature because of its sensitivity to deviations
from the normality assumption. In this dissertation, we first establish a new link
between the censored regression model and the class of asymmetric distributions
studied by Ferreira et al. [13]. Skew scale mixtures of normal distributions are
often used for statistical procedures involving asymmetric data and heavy-tailed.
The main virtue of the members of this family of distributions is that they are
easy to simulate and also provide expectation-maximization (EM) algorithms for
maximum likelihood estimation. In this work, we extend the EM algorithm for the
MCEM algorithm for linear regression models censored. The EM-type algorithm
has been discussed with an emphasis on the Skew-normal, Skew Student-t-normal,
Skew slash and Skew-contaminated normal distributions. The proposed methods
are verified through the analysis of several simulation studies and applying in real
datasets. Um problema frequente na análise de regressão é quando a observação da variável
resposta é censurada para alguns indivíduos. Isto ocorre em várias situações
práticas, por razões como limitações do equipamento de medição ou do desenho
experimental. Estes fenômenos podem ser modelados mediante modelos estatísticos
e matemáticos. No âmbito dos modelos de regressão censurados, os erros
aleatórios são rotineiramente considerados como tendo uma distribuição normal,
principalmente por conveniência matemática. No entanto, este método tem sido
criticado na literatura por causa de sua sensibilidade a desvios da suposição de
normalidade. Nessa dissertação, primeiro estabelecemos uma nova ponte entre o
modelo de regressão censurado e a classe de distribuições assimétricas estudadas
por Ferreira et al. [13]. As misturas de escala assimétricas das distribuições normais
são frequentemente utilizadas para procedimentos estatísticos que envolvem dados
assimétricos e caudas pesadas. A principal virtude dos membros dessa família de
distribuições é que eles são fáceis de serem simulados e também fornecem algoritmos
tipo Esperança-Maximização (EM) para a estimativa de máxima verosimilhança.
Neste trabalho, estendemos o algoritmo EM para o algoritmo MCEM para modelos
de regressão lineares censurados. O algoritmo do tipo EM foi discutido com ênfase
nas distribuições Normal Assimétrica, t-Student Assimétrica, Slash Assimétrica e
Normal-Contaminada Assimétrica. Os métodos propostos são verificados através
da análise de vários estudos de simulação e aplicação em conjuntos de dados reais.