Trabajo de grado - Maestría
Causal Inference in the presence of causally connected units: a semi-parametric hierarchical structural equation model approach
Fecha
2017Autor
Cárdenas Hurtado, Camilo Alberto
Institución
Resumen
Abstract. Causal inference has become a dominant research area in both theoretical and empirical statistics. One of the main drawbacks of conventional frameworks is the assumption of no causal interactions among individuals (i.e independent units). Violation of this assumption often yields biased estimations of causal effects of an intervention in quantitative social, biomedical and epidemiological research. This document proposes a novel approach for modeling causal connections among units within the Structural Causal Model framework: a Semi-Parametric Hierarchical Structural Equation Model (SPHSEM). Estimation uses Bayesian techniques, and the empirical performance of the proposed model is evaluated through both simulation and applied studies. Results prove that the Bayesian SPHSEM recovers nonlinear (causal) relationships between latent variables belonging to different levels and yields unbiased estimates of the (causal) model parameters. La inferencia causal se ha convertido en un área activa de investigación en la estadística teórica y aplicada. Una falencia de las aproximaciones convencionales es el supuesto de ausencia de interacciones causales entre individuos (unidades independientes de estudio). La violación de este supuesto resulta en estimaciones sesgadas de los efectos causales en investigaciones sociales, biomédicas y epidemiológicas. En este documento se propone una nueva manera de modelar dichas conexiones causales bajo el Modelo Estructural de Causalidad: un modelo Semi-Paramétrico, Jerárquico de Ecuaciones Estructurales (SPHSEM). La estimación se hace mediante técnicas Bayesianas, y su capacidad empírica se evalúa a través tanto de un ejercicio de simulación como de una aplicación empírica. Los resultados confirman que el SPHSEM Bayesiana recupera las relaciones causales no lineales que existen entre variables latentes pertenecientes a distintos niveles de agrupamiento, y que las estimaciones de los parámetros causales son insesgadas.