info:eu-repo/semantics/article
Retaining principal components for discrete variables
Retención de componentes principales para variables discretas
Fecha
2012-01Registro en:
Solanas, Antonio; Manolov, Rumen; Leiva, David; Richard's, Maria Marta; Retaining principal components for discrete variables; Universidad de Barcelona; Anuario de Psicología; 41; 1-3; 1-2012; 33-50
0066-5126
CONICET Digital
CONICET
Autor
Solanas, Antonio
Manolov, Rumen
Leiva, David
Richard's, Maria Marta
Resumen
El presente estudio trata sobre diferentes criterios para la retención de componentes en el análisis de componentes principales (PCA) aplicado a escalas tipo Likert, que son comunes en los cuestionarios psicológicos. El principal objetivo del estudio es recomendar a los investigadores no confiar en el criterio de extracción fundamentado en criterio del autovalor mayor que uno, sugiriendo procedimientos alternativos que se ajusten al error muestral. Un objetivo adicional consiste en añadir evidencia sobre las consecuencias de utilizar el criterio antes mencionado cuando el PCA se usa con variables discretas. Las condiciones experimentales se estudiaron por medio de remuestreo Monte Carlo, incluyendo distintos tamaños de muestra, diversas cantidades de reactivos y alternativas de respuesta y, finalmente, diferentes distribuciones de probabilidad para las opciones de respuesta. Los resultados sugieren que, incluso cuando todos los ítems y las dimensiones subyacentes son independientes, los autovalores mayores que uno son frecuentes y pueden dar cuenta de hasta el 80% de la varianza de los datos, alcanzándose el criterio empírico. Las consecuencias de utilizar el criterio de Kaiser se ilustran con un ejemplo propio de la Psicología clínica. Se halló que el tamaño de los autovalores es una función del tamaño de la muestra y del número de variables, que se corresponde con lo encontrado previamente para el parallel analysis. Para potenciar la aplicación de criterios alternativos, un paquete en R fue desarrollado para decidir el número de componentes principales que deben retenerse y recurriendo a intervalos de confianza fundamentados en los autovalores asociados a la inexistencia de asociación entre las variables discretas. The present study discusses retention criteria for principal components analysis (PCA) applied to Likert scale items typical in psychological questionnaires. The main aim is to recommend applied researchers to restrain from relying only on the eigenvalue-than-one criterion; alternative procedures are suggested for adjusting for sampling error. An additional objective is to add evidence on the consequences of applying this rule when PCA is used with discrete variables. The experimental conditions were studied by means of Monte Carlo sampling including several sample sizes, different number of variables and answer alternatives, and four non-normal distributions. The results suggest that even when all the items and thus the underlying dimensions are independent, eigenvalues greater than one are frequent and they can explain up to 80% of the variance in data, meeting the empirical criterion. The consequences of using Kaiser’s rule are illustrated with a clinical psychology example. The size of the eigenvalues resulted to be a function of the sample size and the number of variables, which is also the case for parallel analysis as previous research shows. To enhance the application of alternative criteria, an R package was developed for deciding the number of principal components to retain by means of confidence intervals constructed about the eigenvalues corresponding to lack of relationship between discrete variables.