Diferencia entre los peldaños dos y tres en la escalera de la causalidad

12

En el "Libro de por qué" de Judea Pearl, habla de lo que llama la Escalera de la causalidad, que es esencialmente una jerarquía compuesta de diferentes niveles de razonamiento causal. El más bajo se refiere a los patrones de asociación en los datos observados (p. Ej., Correlación, probabilidad condicional, etc.), el siguiente se centra en la intervención (¿qué sucede si cambiamos deliberadamente el proceso de generación de datos de alguna manera preespecificada?), Y el tercero es contrafactual (¿qué pasaría en otro mundo posible si algo hubiera sucedido o no)?

Lo que no entiendo es cómo difieren los peldaños dos y tres. Si hacemos una pregunta contrafáctica, ¿no estamos simplemente haciendo una pregunta sobre la intervención para negar algún aspecto del mundo observado?

dsaxton
fuente
¿Esto es realmente sobre el tema? Pidiendo por curiosidad
Firebug
55
@Firebug es la causalidad en el tema? Si desea calcular la probabilidad de contrafactuales (como la probabilidad de que un medicamento específico sea suficiente para la muerte de alguien) debe comprender esto.
Carlos Cinelli

Respuestas:

13

No hay contradicción entre el mundo de los hechos y la acción de interés en el nivel intervencionista. Por ejemplo, fumar hasta hoy y verse obligado a dejar de fumar a partir de mañana no están en contradicción entre sí, aunque podría decirse que uno "niega" al otro. Pero ahora imagine el siguiente escenario. Conoces a Joe, un fumador de por vida que tiene cáncer de pulmón, y te preguntas: ¿qué pasaría si Joe no hubiera fumado durante treinta años, estaría sano hoy? En este caso estamos tratando con la misma persona, al mismo tiempo, imaginando un escenario donde la acción y el resultado están en contradicción directa con los hechos conocidos.

Por lo tanto, la principal diferencia de las intervenciones y los contrafácticos es que, mientras que en las intervenciones se pregunta qué sucederá en promedio si realiza una acción, en los contrafácticos se pregunta qué hubiera sucedido si hubiera tomado un curso de acción diferente en una situación específica , dado que tiene información sobre lo que realmente sucedió. Tenga en cuenta que, dado que ya sabe lo que sucedió en el mundo real, debe actualizar su información sobre el pasado a la luz de la evidencia que ha observado.

¡Estos dos tipos de consultas son matemáticamente distintos porque requieren diferentes niveles de información para ser respondidos (los contrafactuales necesitan más información para ser respondidos) y un lenguaje aún más elaborado para ser articulado !.

Con la información necesaria para responder las preguntas del escalón 3, puede responder las preguntas del escalón 2, pero no al revés. Más precisamente, no puede responder preguntas contrafácticas con solo información intervencionista. Los ejemplos en los que se produce el choque de intervenciones y contrafactuales ya se dieron aquí en CV, vea esta publicación y esta publicación . Sin embargo, en aras de la exhaustividad, incluiré un ejemplo aquí también.

El siguiente ejemplo se puede encontrar en Causalidad, sección 1.4.4.

x=1x=0y=0y=1P(y|x)=0.5   x,y

P(Y=1|do(X=1))P(Y=1|do(X=0)=0

P(Y0=0|X=1,Y=1)

Esta pregunta no se puede responder solo con los datos de intervención que tiene. La prueba es simple: puedo crear dos modelos causales diferentes que tendrán las mismas distribuciones intervencionistas, pero diferentes distribuciones contrafácticas. Los dos se proporcionan a continuación:

ingrese la descripción de la imagen aquí

UP(y,x)

Tenga en cuenta que, en el primer modelo, el tratamiento no afecta a nadie, por lo tanto, el porcentaje de aquellos pacientes que murieron bajo el tratamiento que se habrían recuperado si no hubieran tomado el tratamiento es cero.

Sin embargo, en el segundo modelo, cada paciente se ve afectado por el tratamiento, y tenemos una mezcla de dos poblaciones en las que el efecto causal promedio resulta ser cero. En este ejemplo, la cantidad contrafáctica ahora llega al 100% --- en el Modelo 2, todos los pacientes que murieron bajo tratamiento se habrían recuperado si no hubieran tomado el tratamiento.

Por lo tanto, existe una clara distinción entre el peldaño 2 y el peldaño 3. Como muestra el ejemplo, no puede responder preguntas contrafácticas con solo información y suposiciones sobre las intervenciones. Esto se aclara con los tres pasos para calcular un contrafactual:

  1. P(u)P(u|e)
  2. do(x))
  3. Y

Esto no será posible calcular sin alguna información funcional sobre el modelo causal, o sin alguna información sobre variables latentes.

Carlos Cinelli
fuente
Interesante respuesta! Un par de seguimientos: 1) Usted dice " Con la información del renglón 3 puede responder las preguntas del renglón 2, pero no al revés ". Pero en su ejemplo de fumar, no entiendo cómo saber si Joe estaría sano si nunca hubiera fumado responde a la pregunta '¿Estaría sano si dejara de fumar mañana después de 30 años de fumar'? Parecen preguntas distintas, así que creo que me falta algo.
mkt - Restablecer Monica
Además, su ejemplo trabajado posterior se basa en las 2 variables no observadas que se distribuyen de forma no aleatoria entre el tratamiento y el control. Pero usted describió esto como un experimento aleatorizado, entonces, ¿no es este un caso de mala asignación al azar? Con una aleatorización adecuada, no veo cómo obtienes dos resultados tan diferentes a menos que me falte algo básico.
mkt - Restablecer Monica
@mkt del último al primero. La variable no observada se distribuye aleatoriamente entre el tratamiento y el control, tiene exactamente el 50% de cada categoría de u en ambos brazos. Por información entendemos la especificación parcial del modelo necesaria para responder consultas contrafactuales en general, no la respuesta a una consulta específica. Para responder consultas contrafactuales necesita la estructura causal + alguna información funcional o información de la distribución de las variables latentes.
Carlos Cinelli
0

Aquí está la respuesta que Judea Pearl dio en Twitter :

Los lectores preguntan: ¿por qué la intervención (peldaño-2) es diferente de la contrafactual (peldaño-3)? ¿La intervención no niega algunos aspectos del mundo observado?

Resp. Las intervenciones cambian pero no contradicen el mundo observado, porque el mundo anterior y posterior a la intervención conlleva variables temporales. En contraste, "si hubiera estado muerto" contradice los hechos conocidos. Para una discusión reciente, vea esta discusión .

Observación: Tanto el grupo #causalinference de Harvard como el posible marco de resultados de Rubin no distinguen Rung-2 de Rung-3.

Esto, creo, es una resistencia culturalmente arraigada que será rectificada en el futuro. Se deriva del origen de ambos marcos en la metáfora "como si fuera al azar", en oposición a la metáfora física "escucha" de #Bookofwhy

Benjamin Crouzier
fuente