Tesis
Parametric quantile regression for income data
Fecha
2022-07-28Registro en:
BORGES, Giovanna Valadares. Parametric quantile regression for income data. 2022. xiv, 33 f., il. Dissertação (Mestrado em Estatística) — Universidade de Brasília, Brasília, 2022.
Autor
Borges, Giovanna Valadares
Institución
Resumen
Modelos de regressão normais univariados são ferramentas estatísticas amplamente aplicadas
em muitas áreas da economia. No entanto, dados de renda têm comportamento assimétrico e
tem melhor performance de modelagem com distribuições não-normais. A modelagem da renda
desempenha um papel importante na determinação dos ganhos dos trabalhadores, além de ser
um importante tópico de pesquisa em economia do trabalho. Os modelos de regressão quantílica
são alternativas robustas aos modelos tradicionais baseados em média. Isso porque, ao invés de
focar na média condicional, esses modelos são baseados no quantil condicional, como a mediana. A abordagem quantílica tem a vantagem de proporcionar flexibilidade na modelagem, pois
permite considerar os efeitos das variáveis explicativas em todo o espectro da variável dependente, incluindo assim também o efeito sobre a mediana, que é uma medida de tendência central
melhor que a média no contexto assimétrico. A modelagem de renda começou com proposições
de Vilfredo Pareto, estabelecendo uma lei sobre como funciona a distribuição de renda. Mais
tarde, essas proposições sugeriram uma distribuição - conhecida como distribuição de Pareto -
que estabeleceu uma referência para outras distribuições, como log-normal e gama, para mostrar
seu potencial na descrição da distribuição de renda. No entanto, apesar de Pareto, Log-Normal
e Gama serem as distribuições mais frequentemente aplicadas aos dados de renda devido à sua
capacidade de descrever esse tipo de dado, elas têm limitações. O modelo de Pareto é mais apropriado apenas para descrever a cauda superior da distribuição. Por outro lado, as distribuições Log-Normal e Gama têm um desempenho ruim na descrição das caudas superior e inferior
em distribuições reais. Distribuições de renda como Dagum e Singh-Maddala mostraram, na
literatura, terem capacidade de superar as distribuições de Pareto, log-normal e gama em termos de ajuste de modelo. A distribuição Dagum tem flexibilidade para lidar com mudanças
de distribuição, renda nula e negativa; faixa de renda com início de renda mínima positiva não
predeterminada e funções de densidade estritamente decrescentes e unimodais. Ela também
demonstra ter uma boa qualidade de ajuste, acomodando bem caudas pesadas, característica comumente encontrada em dados de renda. Já a distribuição de Singh-Maddala deriva do conceito
de taxa de risco, uma abordagem amplamente utilizada na literatura de confiabilidade. Uma de
suas vantagens é ser mais flexível que outras distribuições de renda. As distribuições Dagum
e Singh-Maddala são casos especiais da distribuição beta generalizada do segundo tipo (GB2)
e ambas obedecem à lei fraca lei de Pareto, isto é, convergem assintoticamente à distribuição
de Pareto. Desta forma, o objetivo deste trabalho é propor modelos de regressão quantílicos
paramétricos baseados em duas importantes distribuições de renda assimétricas, a saber, as
distribuições Dagum e Singh-Maddala. Os modelos quantílicos propostos são baseados em
reparametrizações das distribuições originais, através da inserção de um parâmetro de quantil. Essa abordagem leva em consideração o ganho em flexibilidade de modelagem, tornando
possível analisar os modelos reparametrizados propostos a partir dos efeitos das variáveis explicativas ao longo do espectro da variável dependente, com especial foco no efeito da mediana.
São apresentadas as reparametrizações, algumas importantes propriedades das distribuições, e
os modelos de regressão quantílica em conjunto com o processo inferencial, levando em consideração também a inclusão do parâmetro quantílico em métricas econométricas como Índice de
Gini e as Curvas de Lorenz e Bonferroni – utilizadas para avaliar o grau de desigualdade entre
indivíduos, principalmente no âmbito de renda. Em seguida, apresentamos estudos de simulação de Monte Carlo, considerando a avaliação do desempenho das estimativas de máxima
verossimilhança e uma análise da distribuição empírica dos resíduos para avaliar a performance
geral dos modelos. Para estudar os estimadores de máxima verossimilhança, usamos o cálculo do viés, erro quadrático médio (MSE) e probabilidade de cobertura (CP). Espera-se que, à medida que o tamanho da amostra aumente, o viés e o MSE diminuam, à medida que o CP se
aproxima do nível nominal de 95%. Já para o estudo dos resíduos, analisamos os resultados
dos resíduos Cox-Snell Generalizado (GCS) e Quantil Randomizado (RQ) com as respectivas
estatísticas descritivas (média, mediana, desvio padrão, coeficiente de assimetria e coeficiente
de curtose). Foi possível notar que ambos os modelos atendem aos resultados esperados para
esses estudos, com as estimativas apresentando bom desempenho e os resíduos com boa concordância em relação às suas distribuições de referência. Para a aplicação a dados reais, foram
usados dados de renda familiar chilena em 2016, fornecido pelo Instituto Nacional de Estatística do Chile. Os resultados dos nossos modelos com esse conjunto de dados foram comparados
ao estudo anterior que propôs um modelo de regressão quantílica Birnbaum-Saunders (Sánchez
et al., 2021b). Os resultados mostram que ambos os modelos propostos tiveram um desempenho melhor que o Birnbaum-Saunders, com ajustes melhores e melhor adaptabilidade em
relação aos resíduos. Assim, conclui-se que os resultados foram favoráveis ao uso dos modelos de regressão quantílica de Singh-Maddala e Dagum para dados positivos com assimetria,
especialmente para dados de renda.