Otro
Estimación de áreas pequeñas utilizando imputación múltiple en modelos logísticos de tres parámetros
Fecha
2020-10-30Registro en:
Tellez Piñerez, C. F. (2020). Estimación de áreas pequeñas utilizando imputación múltiple en modelos logísticos de tres parámetros [Tesis de doctorado, Universidad Nacional de Colombia]. Repositorio Institucional.
Autor
Tellez Piñerez, Cristian Fernando
Institución
Resumen
Generar datos de alta calidad y bajo costo es una necesidad para los tomadores de decisiones.
En el sector educativo, estos datos son necesarios para decidir sobre la creación de políticas públicas, la continuidad de los programas existentes y la asignación de recursos año por año. En esta tesis se propone una metodología que incorpora la teoría de respuesta al ítem con la estimación en áreas pequeñas en presencia de datos faltantes.
Se propone un estimador insesgado para el promedio de la habilidad de los estudiantes y un estimador bayesiano basado en la distribución beta, para la proporción de estudiantes que cuenten con una característica particular. Estos estimadores se comparan, vía simulación con los estimadores más usados en la práctica como lo son el estimador de Horvitz-Thompson, calibración y estimadores compuestos, para el caso del promedio, y para el caso de la proporción, se compara con el estimador de una razón y el estimador bayesiano para la proporción basado en la distribución normal. Concluyendo con esto que, los estimadores propuestos tienen menores errores estándar relativos y a su vez, son insesgados para el caso del promedio y aproximadamente insesgados para el caso de la proporción. Adicional a lo anterior, se hacen dos aplicaciones de esta metodología, la primera, utilizando los resultados de la prueba de matemáticas de PISA presentada en el año 2015 y la segunda, utilizando los resultados de las pruebas Saber 3°, 5° y 9° aplicada por el Icfes en Colombia. Para la primera, se comparan los resultados publicados con los obtenidos utilizando esta metodología en términos de precisión y a su vez, se predicen algunos países, observándose que los sesgos relativos de estas predicciones son pequeños. Para la segunda, se toma la muestra controlada, la cual implica más seguridad en la aplicación y en la posible copia entre participantes, y se predicen los resultados a nivel de entidades territoriales certifi cadas (ETC). Concluyendo con esto, que esta metodología es una buena alternativa para la generación de estadísticas ofi ciales en el sector educativo. Generating high-quality low-cost data is a must for decision makers. In the education sector, these data are necessary to decide on the creation of public policies, the continuity of the a ected programs and the allocation of resources year by year. In this thesis, a methodology is proposed that incorporates item response theory methods and small area estimation in the presence of missing data. An unbiased estimator for the average of students ability and a Bayesian estimator based on the Beta distribution for the proportion of students with a particular characteristic are proposed. These estimators are compared, via simulation, with the estimators most used in survey practice for the mean
population such as the Horvitz-Thompson, calibration and composite estimator. Regarding the estimator of a proportion, its estimator is compared with the ratio estimator and the Bayesian estimator based on a normal distribution. The proposed estimators have lower relative standard errors, they are unbiased for the mean estimator and approximately unbiased for the proportion case. In addition, two applications of this methodology were implemented; the rst one, using the PISA mathematics test results in 2015 and the second one, using the results of Saber 3°, 5° y 9° tests applied by Icfes in Colombia. In the PISA case, the published results are compared with those obtained using this methodology in terms of precision and, in turn, some countries are predicted, observing that the relative biases of these predictions are small. In the Icfes application the results are predicted at the level of certi ed territorial entities (ETC). In conclusion, this methodology is a good alternative for the generation of o cial statistics in the educational sector.