info:eu-repo/semantics/masterThesis
Modelos de regressão para resposta binária na presença de dados desbalanceados
Modelos de regresión para respuesta binaria en presencia de datos balanceados
Autor
De La Cruz Huayanay, Alex
Resumen
Descargue la tesis en el repositorio institucional de la Universidade Federal de São Carlos: https://doi.org/10.11606/D.104.2019.tde-08082019-103210 Estudia los modelos de regresión binaria usando funciones de enlace potencia y potencia inversa en presencia de datos desbalanceados. En este trabajo se evalúan dos métodos de corrección desarrollados para lidiar con datos desbalanceados y se comparan con el uso de enlaces asimétricos.
Los resultados basados en el estudio de simulación muestran que los métodos de corrección no corrigen adecuadamente el sesgo en la estimación de los coeficientes de regresión y que los modelos con enlaces asimétricos potencia y potencia inversa considerados producen mejores resultados para ciertos tipos de datos desbalanceados.
Adicionalmente, presentamos una aplicación para datos desbalanceados, identificando el mejor modelo entre varios propuestos. Na regressão binária, o desbalanceamento de dados refere-se à presença de valores zeros (ou uns) numa proporção significativamente maior do que os correspondentes valores uns (ou zeros). Neste trabalho, estudamos dois métodos desenvolvidos para lidar com o desbalanceamento e comparamos eles com o uso de funções de ligação assimétrica potência e reversa de potência. Os resultados mostram que esses métodos não corrigem adequadamente o viés nas estimativas dos coeficientes de regressão e que os modelos com função de ligação assimétrica considerados produzem melhores resultados para certo tipo de desbalanceamento. Adicionalmente, apresentamos uma aplicação para dados desbalanceados identificando o melhor modelo entre vários modelos propostos. A estimação dos parâmetros é realizada sob abordagem Bayesiana considerando o método de estimação Monte Carlo Hamiltoniano usando o algoritmo No-U-Turn Sampler e as comparações dos modelos são desenvolvidas utilizando diferentes critérios para comparação de modelos, avaliação preditiva e resíduos quantílicos.