tesis de maestría
Los valores faltantes en las encuestas sociales: comparación de los enfoques Bayesiano objetivo y frecuentista
Date
2021Author
Bartels Gómez, Sofía de los Ángeles
Institutions
Abstract
La aparición de datos faltantes en las Investigaciones Sociales es frecuente, este problema
ha tomado relevancia en los últimos años por las implicaciones que tienen sobre la validez
de las técnicas estadísticas empleadas, los resultados y las conclusiones que se reportan
en los estudios. Además, su abordaje implica una serie de cuestionamientos que deben
de considerarse para determinar si las observaciones han sido perdidas al azar o si su falta
se debe a causas definibles, llevando esto a debatirsi estos datos pueden o no ser tratados
como ignorables, así como la conveniencia, facilidad y apropiado de utilizar algún método
de imputación para su recuperación. Por lo anterior se plantea esta investigación, cuyo
objetivo es comparar el enfoque Bayesiano Objetivo y Frecuentista para la imputación de
valores faltantes en un contexto típico de encuestas de investigación social.
El estudio de simulación permitió evidenciar que, fijar por defecto en 10 la cantidad de
iteraciones del mecanismo de imputación múltiple permite minimizar el tiempo de
procesamiento estadísticos y no implica que se vea incrementado el sesgo. Además, se
detecta la relevancia de la magnitud de la asociación entre la variable con el dato faltante
y las independientes utilizadas para su predicción, en el nivel de precisión resultante del
proceso de imputación múltiple. Entre mayor sea esta, menor es el error promedio
introducido en los datos, independientemente del enfoque de estimación utilizado
(frecuentista o bayesiano).
Finalmente, a partir de lo encontrado en esta investigación, se puede concluye que
existen casos en los que la imputación múltiple no es recomienda, específicamente en
aquellos donde la asociación entre la variable con datos faltantes y las predictoras sea
moderada (menor a 0.55), esto porque se observan grandes diferencias entre resultados
que arrojan los datos completos originales, y los que se generarían a partir de una
imputación. Por lo que se recomienda incluir en el diseño de investigación un plan de
teoría de los valores faltantes y valorar la implementación alternativa de incentivos a los
participantes para minimizar la cantidad de datos faltantes.