Tesis
Predicción de la pobreza en Argentina usando Random Forest
Autor
Cardinale Lagomarsino, Bruno
Institución
Resumen
Este trabajo utiliza el algoritmo de aprendizaje Random Forest (RF) aplicado a la Encuesta
Permanente de Hogares (EPH) para encontrar los principales predictores no monetarios de la
pobreza en Argentina. El principal resultado es que el algoritmo RF permite identificar a los
hogares pobres con un error de predicci´on del 19% y a los hogares no pobres con un error del
15% en la especificación más adecuada del modelo, en la cual se implementa una corrección
por desbalanceo muestral de la variable de respuesta. Finalmente, se practican distintos
chequeos de robustez y se presentan los resultados preliminares de las estimaciones. Los
predictores principales de la situación de pobreza son: la cantidad de miembros del hogar, la
edad del principal sostén del hogar, la cobertura médica y el nivel de educación. Finalmente,
se discuten ventajas y desventajas de la metodología utilizada.