Parametric quantile regression for income data

Borges, Giovanna Valadares

Tesis

Fecha

2022-07-28

Registro en:

BORGES, Giovanna Valadares. Parametric quantile regression for income data. 2022. xiv, 33 f., il. Dissertação (Mestrado em Estatística) — Universidade de Brasília, Brasília, 2022.

https://repositorio.unb.br/handle/10482/44359

http://repositorioslatinoamericanos.uchile.cl/handle/2250/3847030

Autor

Borges, Giovanna Valadares

Institución

Universidade de Brasília (Brasil)

Resumen

Modelos de regressão normais univariados são ferramentas estatísticas amplamente aplicadas em muitas áreas da economia. No entanto, dados de renda têm comportamento assimétrico e tem melhor performance de modelagem com distribuições não-normais. A modelagem da renda desempenha um papel importante na determinação dos ganhos dos trabalhadores, além de ser um importante tópico de pesquisa em economia do trabalho. Os modelos de regressão quantílica são alternativas robustas aos modelos tradicionais baseados em média. Isso porque, ao invés de focar na média condicional, esses modelos são baseados no quantil condicional, como a mediana. A abordagem quantílica tem a vantagem de proporcionar flexibilidade na modelagem, pois permite considerar os efeitos das variáveis explicativas em todo o espectro da variável dependente, incluindo assim também o efeito sobre a mediana, que é uma medida de tendência central melhor que a média no contexto assimétrico. A modelagem de renda começou com proposições de Vilfredo Pareto, estabelecendo uma lei sobre como funciona a distribuição de renda. Mais tarde, essas proposições sugeriram uma distribuição - conhecida como distribuição de Pareto - que estabeleceu uma referência para outras distribuições, como log-normal e gama, para mostrar seu potencial na descrição da distribuição de renda. No entanto, apesar de Pareto, Log-Normal e Gama serem as distribuições mais frequentemente aplicadas aos dados de renda devido à sua capacidade de descrever esse tipo de dado, elas têm limitações. O modelo de Pareto é mais apropriado apenas para descrever a cauda superior da distribuição. Por outro lado, as distribuições Log-Normal e Gama têm um desempenho ruim na descrição das caudas superior e inferior em distribuições reais. Distribuições de renda como Dagum e Singh-Maddala mostraram, na literatura, terem capacidade de superar as distribuições de Pareto, log-normal e gama em termos de ajuste de modelo. A distribuição Dagum tem flexibilidade para lidar com mudanças de distribuição, renda nula e negativa; faixa de renda com início de renda mínima positiva não predeterminada e funções de densidade estritamente decrescentes e unimodais. Ela também demonstra ter uma boa qualidade de ajuste, acomodando bem caudas pesadas, característica comumente encontrada em dados de renda. Já a distribuição de Singh-Maddala deriva do conceito de taxa de risco, uma abordagem amplamente utilizada na literatura de confiabilidade. Uma de suas vantagens é ser mais flexível que outras distribuições de renda. As distribuições Dagum e Singh-Maddala são casos especiais da distribuição beta generalizada do segundo tipo (GB2) e ambas obedecem à lei fraca lei de Pareto, isto é, convergem assintoticamente à distribuição de Pareto. Desta forma, o objetivo deste trabalho é propor modelos de regressão quantílicos paramétricos baseados em duas importantes distribuições de renda assimétricas, a saber, as distribuições Dagum e Singh-Maddala. Os modelos quantílicos propostos são baseados em reparametrizações das distribuições originais, através da inserção de um parâmetro de quantil. Essa abordagem leva em consideração o ganho em flexibilidade de modelagem, tornando possível analisar os modelos reparametrizados propostos a partir dos efeitos das variáveis explicativas ao longo do espectro da variável dependente, com especial foco no efeito da mediana. São apresentadas as reparametrizações, algumas importantes propriedades das distribuições, e os modelos de regressão quantílica em conjunto com o processo inferencial, levando em consideração também a inclusão do parâmetro quantílico em métricas econométricas como Índice de Gini e as Curvas de Lorenz e Bonferroni – utilizadas para avaliar o grau de desigualdade entre indivíduos, principalmente no âmbito de renda. Em seguida, apresentamos estudos de simulação de Monte Carlo, considerando a avaliação do desempenho das estimativas de máxima verossimilhança e uma análise da distribuição empírica dos resíduos para avaliar a performance geral dos modelos. Para estudar os estimadores de máxima verossimilhança, usamos o cálculo do viés, erro quadrático médio (MSE) e probabilidade de cobertura (CP). Espera-se que, à medida que o tamanho da amostra aumente, o viés e o MSE diminuam, à medida que o CP se aproxima do nível nominal de 95%. Já para o estudo dos resíduos, analisamos os resultados dos resíduos Cox-Snell Generalizado (GCS) e Quantil Randomizado (RQ) com as respectivas estatísticas descritivas (média, mediana, desvio padrão, coeficiente de assimetria e coeficiente de curtose). Foi possível notar que ambos os modelos atendem aos resultados esperados para esses estudos, com as estimativas apresentando bom desempenho e os resíduos com boa concordância em relação às suas distribuições de referência. Para a aplicação a dados reais, foram usados dados de renda familiar chilena em 2016, fornecido pelo Instituto Nacional de Estatística do Chile. Os resultados dos nossos modelos com esse conjunto de dados foram comparados ao estudo anterior que propôs um modelo de regressão quantílica Birnbaum-Saunders (Sánchez et al., 2021b). Os resultados mostram que ambos os modelos propostos tiveram um desempenho melhor que o Birnbaum-Saunders, com ajustes melhores e melhor adaptabilidade em relação aos resíduos. Assim, conclui-se que os resultados foram favoráveis ao uso dos modelos de regressão quantílica de Singh-Maddala e Dagum para dados positivos com assimetria, especialmente para dados de renda.

Materias

Mostrar el registro completo del ítem