Thesis
Estimación máximo verosímil y mínimos cuadrados en el modelo estadístico lineal mixto: Metodología y análisis
Estimated Maximum Likelihood and Least Squares in the Linear Statistical Mixed Models: Methodology and Analysis
Autor
Méndez Guedez, Vianey Oxalidez
Institución
Resumen
El presente estudio tiene como propósito establecer la metodología de estimación y análisis en el Modelo Lineal Mixto. Estos modelos se utilizan principalmente para describir las relaciones entre una variable respuesta y algunas covariables en los datos que se agrupan de acuerdo a uno o más factores de clasificación, en donde los mismos son de efectos fijos y aleatorios, además brindan la posibilidad de analizar datos dependientes, desbalanceados y con falta de normalidad. Para la presente investigación se describieron los procedimientos teóricos de los métodos de estimación Máximo Verosímil y Máximo Verosímil Restringido (ML y REML), además del Mínimos Cuadrados (GLM). Con el propósito de determinar cuál de las estimaciones del modelo sería la más conveniente, se tomó en consideración el cuadrado medio del residual (CME) y de allí el mejor método será aquel que arroje el menor (CME), ya que este se considera como una herramienta útil para decidir qué tan apropiado es un modelo y determinar la medida en la que el modelo no se ajusta a la información, o si el quitar ciertos términos puede simplificar el modelo de manera favorecedora. El proporciona una forma para elegir el mejor estimador: un CME mínimo a menudo, indica una variación mínima, y por lo tanto se considera un buen estimador. Para contrastar los métodos de estimación antes mencionados, se realizaron dos ejemplos uno para datos simulados (balanceados y desbalanceados) normalmente distribuidos con varianzas homogéneas y otro con datos reales, desbalanceados, enfocados en el área de genética, especialmente en bovinos. Adicionalmente se ajustaron distintos modelos al mismo conjunto de datos reales, por lo tanto, fue necesario seleccionar el más adecuado para éstos, por lo cual se utilizaron los criterios de información como: Criterio de Información de Akaike (AIC) y Criterio de Información de Schwarz o Bayesiano (BIC). Se obtuvo la Máxima Verosimilitud como el método de estimación que arrojó menor cuadrados medios residuales. The present study aims to establish the estimation methodology and analysis in the mixed linear model, these models are mainly used to describe the relationship between a response variable and some covariates in the data that are grouped according to one or more factors of classification, where the same are fixed and random effects, in addition provide the possibility of analyzing data no dependent, unbalanced and lacking of normality. For the present investigation described the theoretical procedures of Maximum Likelihood, Restricted Maximum Likelihood (ML and REML) and Least Squares (GLM) estimation methods. In order to determine which of the estimates of the model would be most suitable, was took into consideration the mean square residual (MSE) and then the best method will be that resulting with the lower (MSE), since this is considered as a useful tool to decide what so proper is a model and determine the extent in which the model does not conform to the information, or remove certain terms can be simplified in ways which promote model. It provides a way to choose the best estimator: a minimum mean square residual often indicates a minimum variation, and is therefore considered a good estimator. To contrast the estimation methods previously mentioned, were performed two examples one for simulated data (balanced and unbalanced) normally distributed with homogeneous variances and other with actual unbalanced data focused on the area of genetics, especially in cattle. Additionally different models at the same set of real data were adjusted, so it was necessary to select the most suitable for them, therefore the information criteria were used as: Akaike Information Criterion (AIC) and Schwarz Information Criterion or Bayesian (BIC). It was obtained the maximum likelihood as the method of estimation with the lower square medium residual.