Inconfianza en el modelo causal de Rubin: explicación de Layman

12

Al implementar el modelo causal de Rubin, uno de los supuestos (no comprobables) que necesitamos es la falta de fundamento, lo que significa

(Y(0 0),Y(1))TEl |X

Donde los LHS son los contrafactuales, la T es el tratamiento y X son las covariables que controlamos.

Me pregunto cómo describir esto a una persona que no sabe mucho sobre el modelo causal de Rubin. Entiendo por qué teóricamente necesitamos esta suposición, pero no estoy seguro conceptualmente de por qué esto es importante. Específicamente, si T es el tratamiento, ¿no debería el resultado potencial depender mucho de él? Además, si tenemos un ensayo aleatorio controlado, a continuación, de forma automática, . ¿Por qué esto es verdad?(Y(0 0),Y(1))T

¿Cómo describirías el supuesto de incontestabilidad / ignorancia a alguien que no ha estudiado el MCR?

RayVelcoro
fuente
En cuanto a la coincidencia de puntaje de propensión, primero es fácil demostrar que la distribución condicional de coincide con la distribución condicional de X | T = 0 , p ( X ) = q . Por lo tanto, la falta de fundamento / ignorancia implica que ( Y ( 0 ) , Y ( 1 ) ) T | p ( X )X El | T=1,pag(X)=qX El | T=0 0,pag(X)=q(Y(0 0),Y(1))  T El | pag(X). Para los ensayos aleatorios, debe ser independiente de cualquier otra variable que participe en los ensayos. T
Viktor

Respuestas:

11

¿Cómo describirías el supuesto de incontestabilidad / ignorancia a alguien que no ha estudiado el MCR?

Con respecto a la intuición para alguien que no está versado en la inferencia causal, creo que aquí es donde podría usar gráficos. Son intuitivos en el sentido de que visualmente muestran "flujo" y también dejarán en claro lo que significa la ignorancia en el mundo real.

La ignorabilidad condicional es equivalente a afirmar que satisface el criterio de puerta trasera. Entonces, en términos intuitivos, puede decirle a la persona que las covariables que eligió para X "bloquean" el efecto de las causas comunes de T e Y (y no abra ninguna otra asociación espuria).XXTY

Si las únicas variables de confusión imaginables de su problema son las variables en la propia , entonces esto es trivial de explicar. Simplemente dice que dado que X contiene todas las causas comunes de T e Y , eso es todo lo que necesita controlar. Entonces podrías decirle que así es como ves el mundo:XXTY

ingrese la descripción de la imagen aquí

El caso más interesante es cuando podría haber otros factores de confusión posibles. Para ser más específicos, incluso se podría pedir a la persona a nombre de un potencial de confusión de su problema - es decir, pedirle que nombrar algo que hace que tanto y S , pero no lo es en X .TYX

Decir los nombres de persona una variable . Entonces se puede decir a esa persona que lo que su suposición de ignorabilidad condicional significa en la práctica es que usted piensa que X se "bloque" el efecto de Z en T y / o Y . ZXZTY

Y deberías darle una razón sustantiva por la que crees que es verdad. Hay muchos gráficos que podrían representar eso, pero digamos que se te ocurre esta explicación: " no sesgará los resultados porque aunque Z causa T e Y , su efecto en T solo pasa por X , que estamos controlando". ZZTYTXY luego muestra este gráfico:

ingrese la descripción de la imagen aquí

Y podrías pensar en otros cofundadores y mostrarle cómo bloquea visualmente en los gráficos.X

Ahora contestando las preguntas conceptuales:

Específicamente, si T es el tratamiento, ¿no debería el resultado potencial depender mucho de él? Además, si tenemos un ensayo controlado aleatorio, entonces automáticamente. ¿Por qué esto es verdad?

T

Esa es también la razón por la cual esto se mantiene automáticamente cuando aleatoriza. Si elige los tratados al azar, esto significa que no verificó sus posibles respuestas al tratamiento para seleccionarlos.


Para complementar la respuesta, vale la pena notar que comprender la ignorancia sin hablar sobre el proceso causal, es decir, sin invocar ecuaciones estructurales / modelos gráficos es realmente difícil. La mayoría de las veces se ven investigadores que apelan a la idea de "el tratamiento fue como si fuera aleatorio" pero sin justificar por qué es así o por qué es plausible utilizando mecanismos y procesos del mundo real.

De hecho, muchos investigadores simplemente asumen la ignorancia por conveniencia, para justificar el uso de métodos estadísticos. Este pasaje del artículo de Joffe, Yang y Feldman dice una verdad incómoda que la mayoría de la gente conoce pero no dice durante las presentaciones de la conferencia: "Las suposiciones de ignorancia generalmente se hacen porque justifican el uso de los métodos estadísticos disponibles, y no porque realmente se crean".

Pero, como dije al comienzo de la respuesta, puede usar gráficos para discutir si una asignación de tratamiento es ignorable o no. Si bien el concepto de ignorabilidad en sí mismo es difícil de comprender, porque establece juicios sobre cantidades contrafácticas, en los gráficos básicamente se hacen declaraciones cualitativas sobre los procesos causales (esta variable causa esa variable, etc.), que son fáciles de explicar y visualmente atractivos.

Como se mencionó en una respuesta anterior, existe una equivalencia formal entre los gráficos y los resultados potenciales . Por lo tanto, también puede leer los resultados potenciales de los gráficos. Para hacer esta conexión más formal (para más información, vea Causalidad de Pearl, p.343), podría recurrir a la siguiente definición: los resultados potenciales representarían el total de todas las variables (términos observados y de error) que afectan a Y cuando T se mantiene constante .

TXY

En resumen, muchos investigadores hacen la suposición de ignorancia por defecto, por conveniencia. Es una forma conveniente de asumir la suficiencia de un conjunto de controles sin necesidad de justificar formalmente por qué ese es el caso, pero para explicar lo que significa en un contexto real para un laico, necesitaría invocar una historia causal, es decir, supuestos causales. , y puedes contar esa historia formalmente con la ayuda de gráficos causales.

Carlos Cinelli
fuente
8

(Y0,Y1)Y

X

Y=TY1+(1T)Y0.

YTTY1(1-T)Y0 0

TXXY1X

Dimitriy V. Masterov
fuente
Mirando la parte donde dice "Creo que se está obsesionando con la diferencia entre los resultados potenciales (Y0, Y1) y el resultado observado Y. Este último está muy influenciado por el tratamiento, pero esperamos que el primer par no lo esté. " ¿Puede interpretarse esto como "El resultado observado depende del tratamiento, pero bajo una hipótesis nula de ningún efecto del tratamiento, el tratamiento no debe influir en los resultados potenciales"? ¿Por qué esperamos que los resultados influyan en los
posibles
1
Y1-Y0 0
TY1(1-T)Y0 0YT
@ user321627 Si calcula la diferencia en los medios de resultado observados para el tratamiento y el control, debería ser obvio.
Dimitriy V. Masterov