Trabalho de Conclusão de Curso
Análise de dados amostrais das Pesquisas AIBF I e II: efeito do plano amostral na estimação de médias
Autor
Miranda Filho, Walmir dos Reis
Institución
Resumen
In cross-sectional and longitudinal surveys, to ignore the sampling design,
especially when it is complex, is still common practice in quantitative analysis, either by
the absence of statistical software that allows for analysis based on the sampling design
or by the unawareness from the data analysts of the importance of incorporating the
sampling design to obtain estimates of the parameters of interest, like means; totals and
proportions. A complex sampling design is defined by characteristics such as
stratification; clustering; sample weights and unequal probabilities of selection, among
other attributes that make it diverge from the simple random sampling presuppositions.
When the complex sampling design is ignored, the obtained estimates may be biased. In
large-scale longitudinal surveys, like the Pesquisa de Avaliação de Impacto do
Programa Bolsa Família (AIBF), used as data source for this monograph, the selection
of a simple random sampling when drawing the population elements is not
economically feasible, which is the reason for the adoption of stratification and
clustering techniques by the survey statisticians who are in charge of the sampling
design. Thus, this monograph‟s aim is to compare alternative statistical techniques
(ignoring or incorporating the sampling design) for the exploratory analysis of the
impact of the Programa Bolsa Família on a parameter strictly associated with a
condition to receive the benefit, that is the mean of the number of prenatal
consultations, estimated for each group of households of the survey, and reinforce the
importance of considering the sampling design. Finally, a measure of how large is the
„cost‟ of ignoring the sample design characteristics is presented: the misspecification
effect. Em pesquisas transversais e longitudinais, ignorar um plano ou desenho amostral,
principalmente quando este é complexo, é uma atitude ainda muito comum em análises
quantitativas, seja pela ausência de programas estatísticos que possuam ferramentas
para análises que considerem o plano amostral, seja pelo desconhecimento dos analistas
da importância da incorporação do plano amostral na obtenção das estimativas dos
parâmetrosde interesse, como médias; totais e proporções. Um plano amostral complexo
é definido por características como estratificação; conglomeração; pesos amostrais e
probabilidades de seleção desiguais, dentre outras características que o afastam das
pressuposições da amostragem aleatória simples. Quando se ignora um plano amostral
complexo, as estimativas obtidas podem se tornar enviesadas. Tratando-se de pesquisas
longitudinais de larga escala, como a Pesquisa de Avaliação de Impacto do Programa
Bolsa Família (AIBF), utilizada como fonte de dados para esta monografia, não é viável
economicamente fazer um sorteio por amostragem aleatória simples dos elementos da
população, razão pela qual os amostristas responsáveis pela pesquisa adotaram técnicas
de estratificação e conglomeração. Assim, esta monografia tem como objetivo comparar
técnicas estatísticas alternativas (ignorando ou incorporando o plano amostral) para a
análise exploratória do impacto do Programa Bolsa Família sobre um parâmetro
estritamente relacionado a uma de suas condicionalidades, que é a média de consultas
de pré-natal, estimada para cada um dos grupos de domicílios da pesquisa, e reforçar a
importância de se considerar o plano amostral. Finalmente, é considerada uma medida
do quanto se erra ao se ignorar as características do plano amostral, o Efeito do Plano
Amostral Ampliado.