Variables del instrumento y restricción de exclusión desde una perspectiva de mediación

8

Tengo problemas para entender la restricción de exclusión en variables instrumentales.

Entiendo que el efecto de tratamiento imparcial es , donde es el resultado, es el tratamiento y es el instrumento. En otras palabras, B = \ frac {ITT} {\ text {Cuota de cumplimiento}} .B=Cov(Y,Z)Cov(S,Z)YSZB=ITTCompliance Rate

Sin embargo, si pienso en esto en un marco de mediación y aplico la restricción de exclusión, esto tiene cada vez menos sentido.

En un marco de mediación, ITT = el efecto total, o el Cov(S,Z)Cov(Y,S)+Cov(Y,Z|S) . Entonces, el efecto de tratamiento imparcial es:

(Cov(S,Z)Cov(Y,S)+Cov(Y,ZEl |S))Cov(S,Z) , que se reduce a:

Cov(Y,S)+Cov(Y,ZEl |S)Cov(S,Z) ,

por lo tanto, la estimación causal imparcial es el efecto del tratamiento sesgado + el efecto del instrumento ( ConortetrollyonortesolForthmitrmiunatmetrominortetCometropagslyounanorteCmirunatmi .

Sin embargo, con la restricción de exclusión, no se supone que haya un efecto del instrumento una vez que controlemos el tratamiento.

Un ejemplo, del ejemplo de Sesman Street de Gelman. Primero, obtener el efecto de tratamiento imparcial a través de 2SLS:

fit.2s <- lm(regular ~ encour, data = df)
watched.hat <- fit.2s$fitted
fit.2b <- lm(postlet ~ watched.hat, data = df)
summary(fit.2b)

lo que da la respuesta, 7.934.

Y ahora, dentro de un marco SEM:

library(foreign)
library(lavaan)
mod  <-
'
regular ~ a*encour
postlet ~ b*regular + c*encour
ind := a*b
total := a*b + c
'
fit <- sem(mod, data = df)
summary(fit)

 Regressions:
               Estimate  Std.Err  Z-value  P(>|z|)
  regular ~                                           
encour     (a)    0.362    0.051    7.134    0.000

  postlet ~                                           
  regular    (b)   13.698    2.079    6.589    0.000
  encour     (c)   -2.089    1.802   -1.160    0.246


  Defined Parameters:
               Estimate  Std.Err  Z-value  P(>|z|)
  ind               4.965    1.026    4.840    0.000
  total             2.876    1.778    1.617    0.106

13.698 - 2.089 / .362 = 7.92

Por lo tanto, la única razón por la que el efecto de tratamiento imparcial no es solo el efecto de tratamiento sesgado es porque todavía hay un efecto del instrumento cuando se controla el tratamiento, lo que, de acuerdo con la restricción de exclusión, no debería suceder.

¿Me estoy perdiendo de algo?

sam
fuente

Respuestas:

1

Usted afirma correctamente que, bajo las suposiciones IV tardías con un efecto causal de la IV Z sobre el tratamiento S, el instrumento exógeno y sin efecto directo sobre el resultado Y, su efecto de tratamiento B de S sobre Y se identifica como

Cov(Y,Z)/ /Cov(S,Z)=yoTT/ /CometropagslyounanorteCmiRunatmi

Tan claramente

yoTT=Cov(Y,Z) ,

y no , como erróneamente. Esto también es intuitivamente claro porque si el instrumento es exógeno con respecto al tratamiento y al resultado, se identifican sus efectos causales y (bajo linealidad) son simplemente la correlación entre el instrumento y el resultado.Cov(S,Z)Cov(Y,S)+Cov(Y,Z)

Además, parece implicar que el IV y el Y no deben estar relacionados en una regresión de Y sobre el tratamiento y el IV. Este no es el caso si el tratamiento S es realmente endógeno. Entonces, es un colisionador, ya que es causado por el IV y el término de error no observado de Y. El condicionamiento del tratamiento hace que el IV y el término de error sean dependientes, y por lo tanto también el IV y el Y. Entonces obtienes un valor distinto de cero coeficiente de regresión incluso si la restricción de exclusión es válida. Esto debería quedar muy claro si dibuja el gráfico causal.

Si no fuera el caso, podríamos probar la restricción de exclusión, ¡pero por supuesto sabemos que generalmente no podemos probarla! (Al menos no tan fácilmente).

Julian Schuessler
fuente
Agregué una edición para aclarar, pero desde una perspectiva de mediación, el ITT es (Cov (S, Z) ⋅Cov (Y, S) + Cov (Y, Z | S)) / Cov (S, Z). Esto es verificable con el ejemplo de Gelman: coef (summary (lm (postlet ~ encour, data = df))) ['encour',] ['Estimate'] = 2.88. De la salida SEM, (Cov (S, Z) ⋅Cov (Y, S) + Cov (Y, Z | S)) / Cov (S, Z) = 2.88 (la estimación próxima al total, que es a * b + c)
sam
Entonces, ¿cómo puede ser también cierto que Cov (Y, Z) / Cov (S, Z) = ITT / ComplianceRate? Su ecuación para el ITT y la fórmula IV no puede ser verdadera al mismo tiempo. Con la restricción de exclusión, su fórmula no es cierta.
Julian Schuessler
1
También tenga en cuenta que "desde una perspectiva de mediación", la ITT es una cantidad causal, por lo que debe definirse en resultados potenciales o con el operador do, no como una función del PDF observable. Por lo tanto, la ITT se define como E (Y | do (Z)), por ejemplo. Ver en.wikipedia.org/wiki/… .
Julian Schuessler
Porque Cov (Y, Z) se puede descomponer en (Cov (S, Z) ⋅Cov (Y, S) + Cov (Y, Z | S)). Tal vez me estoy perdiendo algo aquí, pero ese es mi punto: la identificación del impacto causal se basa en que la restricción de exclusión es falsa, o eso parece.
Sam
He editado mi respuesta. Todavía no entiendo completamente tu confusión. Puede ser muy esclarecedor leer Pearl, Judea. "Modelos lineales: un útil" microscopio "para el análisis causal". Las herramientas allí son extremadamente fáciles y dejan en claro cuán simple es este problema.
Julian Schuessler