Actualmente estoy leyendo el artículo de Pearl (Pearl, 2009, 2ª edición) sobre causalidad y lucha para establecer el vínculo entre la identificación no paramétrica de un modelo y la estimación real. Desafortunadamente, el propio Pearl no dice nada sobre este tema.
Para dar un ejemplo, tengo en mente un modelo simple con una ruta causal, , y un factor de confusión que afecta a todas las variables , y . Además, e están relacionados por influencias no observadas, . Según las reglas del cálculo do, ahora sé que la distribución de probabilidad posterior a la intervención (discreta) viene dada por:w → x w → z w → y x y x ← → y
¿Me pregunto cómo puedo estimar esta cantidad (no paramétricamente o introduciendo supuestos paramétricos)? Especialmente para el caso cuando es un conjunto de varias variables de confusión y cantidades de interés son continuas. Estimar la distribución conjunta previa a la intervención de los datos parece ser muy poco práctico en este caso. ¿Alguien conoce una aplicación de los métodos de Pearl que aborde estos problemas? Estaría muy feliz por un puntero.
Respuestas:
Esta es una muy buena pregunta. Primero verifiquemos si su fórmula es correcta. La información que ha proporcionado corresponde al siguiente modelo causal:
Y como usted ha dicho, podemos derivar el estimado para usando las reglas del cálculo. En R podemos hacer eso fácilmente con el paquete . Primero cargamos para crear un objeto con el diagrama causal que está proponiendo:PAG( YEl | reo ( X) )
causaleffect
igraph
Donde los dos primeros términosX Y
X-+Y, Y-+X
representan los factores de confusión no observados de e y el resto de los términos representan los bordes dirigidos que mencionó.YLuego pedimos nuestro estimado:
Lo que de hecho coincide con su fórmula: un caso de puerta frontal con un factor de confusión observado
Ahora vamos a la parte de estimación. Si asume linealidad (y normalidad), las cosas se simplifican enormemente. Básicamente lo que quiere hacer es estimar los coeficientes de la ruta .X→ Z→ Y
Simulemos algunos datos:
Observe en nuestra simulación que el verdadero efecto causal de un cambio de en es 21. Puede estimar esto ejecutando dos regresiones. En primer lugar para obtener el efecto de sobre y para obtener el efecto de en . Su estimación será el producto de ambos coeficientes:Y Y ∼ Z + W + X Z Y Z ∼ X + W X ZX Y Y∼ Z+ W+ X Z Y Z∼ X+ W X Z
Y por inferencia, puede calcular el error estándar (asintótico) del producto:
Que puede usar para pruebas o intervalos de confianza:
También puede realizar una estimación (no / semi) paramétrica, intentaré actualizar esta respuesta, incluidos otros procedimientos más adelante.
fuente