An alternative to classical latent class models selection methods for sparse binary data: an illustration with simulated data

Araya Alpizar, Carlomagno

Un método alternativo para la selección de modelos de clases latentes en datos binarios escasos: una ilustración con datos sim

dc.creator	Araya Alpizar, Carlomagno
dc.date	2017-04-19
dc.date.accessioned	2023-08-03T16:19:19Z
dc.date.available	2023-08-03T16:19:19Z
dc.identifier	https://revistas.ucr.ac.cr/index.php/matematica/article/view/22448
dc.identifier	10.15517/rmta.v23i1.22448
dc.identifier.uri	https://repositorioslatinoamericanos.uchile.cl/handle/2250/7886744
dc.description	Within the context of a latent class model with manifest binary variables, we propose an alternative method that solves the problem of estimating empirical distribution with sparse contingency tables and the chi-square approximation for goodness-of-fit will not be valid. We analyze sparse binary data, where there are many response patterns with very small expected frequencies in several data sets varying in degree of sparseness from 1 to 5 defined d = n/2p = n/R is a factor that is mentioned in almost all prior literature as being an important determinant of how well the distribution is represented by the chi-squared.The proposed approach produced results that were valid and reliable under the mentioned problematic data conditions. Results from the proposal presented compare the rates of Type I for traditional goodness-of-fit tests. We also show that with data density d ≤ 5, Pearson’s statistic (χ2) should not be used to select latent class models using the Patterns Method, given that this has the probability of Type I error being greater than 5%. By comparing the Patterns Method and the Parametric Bootstrap for data density d = 2, we show that the Patterns Method has more accurate Type I error probabilities since the likelihood ratio, Read-Cressie and Freeman-Tukey statistics afford values of α < 0.05. In contrast, the Parametric Bootstrap provides values in these statistics that surpass 5%.	en-US
dc.description	En el contexto de modelos de clases latentes con variables manifiestas binarias, se propone un método alternativo para resolver el problema de la estimación de la distribución empírica con tablas de contingencias escasas, donde la aproximación de los estadísticos de bondad de ajuste por la distribución Chi-Cuadrada no es válida. Se analiza datos binarios escasos, donde muchos patrones de respuesta que tienen frecuencias esperadas pequeñas, en conjuntos de datos con grados de datos escasos de 1 a 5, donde d = n/2p = n/R es un factor es mencionado en la literatura como determinante de la bondad de ajuste a la distribución Chi-Cuadrada. La propuesta presenta resultados válidos y confiables en las condiciones de los datos mencionadas. Para los resultados se presenta tasas de error tipo I para las pruebas tradiciones de bondad de ajuste. También se muestra que para niveles de densidad de datos d ≤ 5, el estadístico Pearson (χ2) no es el apropiado para seleccionar modelos de clases latentes utilizando el Método de Patrones, dado que presenta probabilidad de error de tipo I más grandes que 5%. Al comparar el Método de Patrones y el Bootstrap Paramétrico para la densidad d = 2, se muestra que el Método de Patrones tiene probabilidades de error de tipo I menores de 5% en los estadísticos de razón de verosimilitud, Read-Cressie y Freeman-Tukey. En contraste, el Bootstrap Paramétrico produce valores en estos estadísticos que superan un 5%.	es-ES
dc.format	application/pdf
dc.language	eng
dc.publisher	Universidad de Costa Rica, Centro de Investigación en Matemática Pura y Aplicada (CIMPA)	es-ES
dc.relation	https://revistas.ucr.ac.cr/index.php/matematica/article/view/22448/22614
dc.rights	Derechos de autor 2016 Revista de Matemática: Teoría y Aplicaciones	es-ES
dc.source	Revista de Matemática: Teoría y Aplicaciones; Vol. 23 No. 1 (2016): Revista de Matemática: Teoría y Aplicaciones; 199-220	en-US
dc.source	Revista de Matemática: Teoría y Aplicaciones; Vol. 23 Núm. 1 (2016): Revista de Matemática: Teoría y Aplicaciones; 199-220	es-ES
dc.source	Revista de Matemática; Vol. 23 N.º 1 (2016): Revista de Matemática: Teoría y Aplicaciones; 199-220	pt-PT
dc.source	2215-3373
dc.source	1409-2433
dc.subject	sparse data	en-US
dc.subject	latent class	en-US
dc.subject	goodness-of-fit	en-US
dc.subject	binary data	en-US
dc.subject	datos escasos	es-ES
dc.subject	clases latentes	es-ES
dc.subject	bondad de ajuste	es-ES
dc.subject	datos binarios	es-ES
dc.title	An alternative to classical latent class models selection methods for sparse binary data: an illustration with simulated data	en-US
dc.title	Un método alternativo para la selección de modelos de clases latentes en datos binarios escasos: una ilustración con datos sim	es-ES
dc.type	info:eu-repo/semantics/article
dc.type	info:eu-repo/semantics/publishedVersion
dc.type	Article	es-ES

Este ítem pertenece a la siguiente institución

Universidad de Costa Rica