Trabalho de Conclusão de Curso
Impactos do desenho amostral complexo na análise de dados da PNAD
Autor
Vieira, Vítor da Fonseca
Institución
Resumen
All kinds of researches are performed in Brazil and in the world currently. The
amount of data available is huge. Sampling methods are very relevant in this context
and, therefore, they were the subject of this study. In this sense, it is essential to take
precautions throughout the sampling process, from before collecting data until the
analysis phase. In this work we adopt the National Household Sample Survey
(PNAD) conducted by the Brazilian Institute of Geography and Statistics (IBGE) as
motivation for the application of the studied methods. The main goal of this work is to
evaluate the potential effects of the lack of consideration of sample design features in
the data analysis of PNAD. We also present a summary of the main types of
sampling designs and inference methods for complex sampling in order to introduce
the subject. The statistical software Stata has helped in the estimation of the mean
and its standard error of the variable "monthly household income per capita" taking
sample design into account or not. In the case of PNAD, some of the consequences
observed when the design was ignored were: (i) underestimation of standard errors
and, therefore, biased confidence intervals; and (ii) different estimated means
compared to those found when sampling design was considered. Pesquisas de todos os tipos são realizadas no Brasil e no mundo atualmente.
A quantidade de dados disponíveis é enorme. Os métodos de Amostragem são de
grande relevância neste contexto e por isso foram objeto de estudo neste trabalho.
Neste sentido, torna-se essencial tomar as devidas precauções durante todo o
processo de amostragem, desde antes da coleta dos dados até a fase de análise
dos mesmos. Nesta monografia adotamos a Pesquisa Nacional por Amostra de
Domicílios (PNAD) realizada pelo Instituto Brasileiro de Geografia e Estatística
(IBGE) como motivação para a aplicação dos métodos estudados. O principal
objetivo deste estudo é avaliar os possíveis efeitos da não consideração das
características do desenho amostral na análise de dados da PNAD. Apresentamos
também um resumo dos principais tipos de planos amostrais e dos métodos de
inferência para planos amostrais complexos para introduzir o assunto. O software
estatístico Stata auxiliou na estimação da média e do seu erro padrão da variável
“renda domiciliar mensal per capita” levando o planejamento amostral em
consideração ou não. No caso da PNAD, algumas das consequências observadas
ao ignorarmos o desenho foram: (i) a subestimação dos erros padrão e
consequentemente intervalos de confiança enviesados; e (ii) estimativas de médias
diferentes das encontradas quando se considera o planejamento amostral.