¿(x) significado del operador?

14

He visto el operador en todas partes en alguna revisión de literatura que estoy haciendo en Causality (ver, por ejemplo, esta entrada de wikipedia ). Sin embargo, no puedo encontrar una definición formal y general de este operador.reo(X)

¿Alguien puede señalarme una buena referencia sobre esto? Estoy interesado en una definición general en lugar de su interpretación en un experimento particular.

Judio
fuente
1
Relacionado con stats.stackexchange.com/questions/69806/…
Carlos Cinelli

Respuestas:

11

Eso es -calculus. Lo explican aquí :reo

Las intervenciones y los contrafácticos se definen a través de un operador matemático llamado , que simula intervenciones físicas eliminando ciertas funciones del modelo, reemplazándolas con una constante X = x , mientras mantiene el resto del modelo sin cambios. El modelo resultante se denota M x .reo(X)X=XMETROX

mbiron
fuente
13

Un modelo probabilístico Causal Estructural (SCM) se define como una tupla donde U es un conjunto de variables exógenas, V un conjunto de variables endógenas, F es un conjunto de ecuaciones estructurales que determina los valores de cada variable endógena y P ( U ) una distribución de probabilidad sobre el dominio de la U .METRO=U,V,F,PAG(U)UVFPAG(U)U

En un SCM que representan el efecto de una intervención en una variable por un submodelo M x = U , V , F x , P ( U ) donde F x indica que la ecuación estructural para X se sustituye por la nueva ecuación intervencionista . Por ejemplo, la intervención atómica de establecer la variable X en un valor específico x --- generalmente denotado por d o ( X = x ) --- consiste en reemplazar la ecuación por XXMETROX=U,V,FX,PAG(U)FXXXXreo(X=X)Xcon la ecuación .X=X

Para aclarar las ideas, imagine un modelo causal estructural no paramétrico definido por las siguientes ecuaciones estructurales:METRO

Z=UzX=F(Z,UX)Y=sol(X,Z,Uy)

Donde las perturbaciones tienen alguna distribución de probabilidad P ( U ) . Esto induce una distribución de probabilidad sobre las variables endógenas P M ( Y , Z , X ) , y en particular una distribución condicional de Y dado X , P M ( Y | X ) .UPAG(U)PM(Y,Z,X)YXPM(Y|X)

Pero aviso es la distribución "observacional" de Y dado X en el contexto de modelo M . ¿Cuál sería el efecto en la distribución de Y si interviniéramos en X estableciéndolo en x ? Esto no es más que la distribución de probabilidad de Y inducida por el modelo modificado M x :PM(Y|X)YXMYXxYMx

Z=UzX=xY=g(X,Z,Uy)

Es decir, la probabilidad intervencionista de si establecemos X = x viene dada por la probabilidad inducida en el submodelo M x , es decir, P M x ( Y | X = x ) y generalmente se denota por P ( Y | d o ( X = x ) ) . El operador d o ( X = x ) deja en claro que estamos calculando la probabilidad de YYX=xMxPMx(Y|X=x)P(Y|do(X=x))do(X=x)Y en un submodelo donde hay una configuración de intervención igual a xXxXX=x

P(Y|do(X))

hacer cálculo

do()P(Y|do(X)) y el do-cálculo está completo para modelos recursivos causales estructurales no paramétricos ).

Carlos Cinelli
fuente
Creo que puede ser uno de los pocos con validación cruzada que podría estar interesado y capaz de responder esta pregunta: stats.stackexchange.com/q/444249/62396
joshphysics