Modeling censored data using finite mixtures of Student-t distributions = Modelagem de dados censurados usando misturas finitas de distribuições t de Student
Modelagem de dados censurados usando misturas finitas de distribuições t de Student
dc.creator | López Moreno, Edgar Javier, 1987- | |
dc.date | 2016 | |
dc.date | 2016-12-12T00:00:00Z | |
dc.date | 2017-05-05T18:44:07Z | |
dc.date | 2017-06-21T18:33:33Z | |
dc.date | 2017-05-05T18:44:07Z | |
dc.date | 2017-06-21T18:33:33Z | |
dc.date.accessioned | 2018-03-29T02:56:32Z | |
dc.date.available | 2018-03-29T02:56:32Z | |
dc.identifier | LÓPEZ MORENO, Edgar Javier. Modeling censored data using finite mixtures of Student-t distributions = Modelagem de dados censurados usando misturas finitas de distribuições t de Student. 2016. 1 recurso online (75 p.). Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matemática Estatística e Computação Científica, Campinas, SP. | |
dc.identifier | http://repositorio.unicamp.br/jspui/handle/REPOSIP/321945 | |
dc.identifier.uri | http://repositorioslatinoamericanos.uchile.cl/handle/2250/1323699 | |
dc.description | Orientadores: Víctor Hugo Lachos Dávila, Celso Rômulo Barbosa Cabral | |
dc.description | Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matemática Estatística e Computação Científica | |
dc.description | Resumo: Os modelos de mistura finita e os modelos de mistura de regressão multivariada tem sido amplamente utilizados na modelagem e análise de dados de uma população heterogênea. Dados desse tipo podem estar submetidos a limites de deteção superior e/ou inferior por causa do aparato experimental. Outra complicação surge quando a distribuição das medidas em cada população não é aproximadamente normal, isso ocorre, por exemplo, na presença de caudas pesadas ou observações atípicas. Para essas estruturas de dados, propomos um modelo robusto para dados censurados com base em misturas finitas de distribuições multivariadas Student-t e um modelo de regressão para dados censurados baseados em misturas finitas t de Student multivariadas. Esta abordagem permite-nos modelar dados com grande flexibilidade, acomodando multimodalidade, caudas pesadas e também assimetria, dependo da estrutura das componentes da mistura. Desenvolvemos um algoritmo do tipo EM para estimação analítico, simples e eficiente. O algoritmo tem expressões de forma fechada no passo-E que dependem de fórmulas para a média e variância da distribuição t de Student multivariada truncada. Além disso, um método geral para aproximação assintótica da matriz de covariância dos estimadores é apresentado. Os resultados obtidos a partir de análise de conjuntos de dados reais e simulados são reportados e demonstram a eficácia da metodologia proposta. Os métodos e algoritmos propostos são implementados no novo pacote de R CensMixReg | |
dc.description | Abstract: Finite mixture models and mixture multivariate regression models have been widely used for the modeling and analysis of data from a heterogeneous population. Moreover, this kind of data can be subjected to some upper and/or lower detection limits because of the restriction of experimental apparatus. Another complication arises when measures of each population depart significantly from normality, for instance, in the presence of heavy tails or atypical observations. For such data structures, we propose a robust model for censored data based on finite mixtures of multivariate Student-t distributions and a regression model for censored data based on finite mixtures of multivariate Student-t distributions. This approach allows us to model data with great flexibility, accommodating multimodality, heavy tails and also skewness depending on the structure of the mixture components. We develop an analytically simple yet efficient EMtype algorithm for conducting maximum likelihood estimation of the parameters. The algorithm has closed-form expressions at the E-step, that rely on formulas for the mean and variance of the multivariate truncated Student-t distributions. Further, a general information-based method for approximating the asymptotic covariance matrix of the estimators is also presented. Results obtained from the analysis of both simulated and real data sets are reported to demonstrate the effectiveness of the proposed methodology. The proposed algorithm and methods are implemented in the new R package CensMixReg | |
dc.description | Mestrado | |
dc.description | Estatistica | |
dc.description | Mestre em Estatística | |
dc.format | 1 recurso online (75 p.) : il., digital, arquivo PDF. | |
dc.format | application/pdf | |
dc.publisher | [s.n.] | |
dc.relation | Requisitos do sistema: Software para leitura de arquivo em PDF | |
dc.subject | Observações censuradas (Estatística) | |
dc.subject | Algoritmos de esperança-maximização | |
dc.subject | Misturas finitas | |
dc.subject | Análise multivariada | |
dc.subject | Modelos de regressão | |
dc.subject | Student-t multivariada | |
dc.subject | Censored observations (Statistics) | |
dc.subject | Expectation-maximization algorithms | |
dc.subject | Finite mixtures | |
dc.subject | Multivariate analysis | |
dc.subject | Regression models | |
dc.subject | Multivariate Student-t | |
dc.title | Modeling censored data using finite mixtures of Student-t distributions = Modelagem de dados censurados usando misturas finitas de distribuições t de Student | |
dc.title | Modelagem de dados censurados usando misturas finitas de distribuições t de Student | |
dc.type | Tesis |