Dejar y ser variables aleatorias es la media condicional de dado . Decimos no está causalmente relacionado con Si no depende de , lo que implica que es igual a . Ahora, sigamos con esta definición de causalidad por un segundo. Por la ley de expectativas iteradas,. Esto significa que si no depende de , si es igual a , entonces .
En otras palabras:
Si y no están causalmente relacionados, entonces y no están correlacionados! - Esto no tiene sentido y sé que esto debe estar mal. ¿He definido la causalidad incorrectamente? ¿Qué he hecho mal?
En econometría generalmente asumimos . Entonces es equivalente a . La lógica también se aplica en este escenario específico.
econometrics
causality
conditional-expectation
cristiano
fuente
fuente
Respuestas:
Has definido la causalidad incorrectamente, sí. Probablemente, haya escuchado el dicho "la correlación no es causalidad". Usted esencialmente ha definido la causalidad como correlación. Sin embargo, el problema es peor que eso. La causalidad no es un concepto estadístico o probabilístico en absoluto, al menos como esos temas se enseñan normalmente. No existe una definición estadística o probabilística de causalidad: nada que implique expectativas condicionales o distribuciones condicionales o similares. Sin embargo, es difícil captar este hecho de los cursos de estadística o econometría.
Desafortunadamente, tendemos a hacer un mejor trabajo diciendo qué no es la causalidad que qué es la causalidad. La causalidad siempre y en todas partes proviene de la teoría, del razonamiento a priori, de los supuestos. Usted mencionó la econometría. Si le han enseñado variables instrumentales de manera competente, entonces sabe que los efectos causales solo pueden medirse si tiene una "restricción de exclusión". Y sabes que las restricciones de exclusión siempre provienen de la teoría.
Sin embargo, dijiste que querías matemáticas. El chico que quieres leer es Judea Pearl . No es matemática fácil, y la matemática a veces se desvía hacia la filosofía, pero eso es porque la causalidad es un tema difícil. Aquí hay una página con más enlaces sobre el tema. Aquí hay un libro en línea gratuito que acabo de encontrar. Finalmente, aquí hay una pregunta anterior donde di una respuesta que podría ser útil.
fuente
Esto está mal. Las relaciones causales son sobre dependencias funcionales / estructurales, no dependencias estadísticas / asociativas. Deberías echar un vistazo aquí.
Sí, lo ha definido incorrectamente, puede consultar los libros / referencias de inferencia causal aquí . Más formalmente, en un modelo de ecuación estructural, el efecto causal deX sobre la distribución de Y , que podemos denotar por P(Y|do(X=x)) --- es decir, cómo cambia X afecta la distribución de Y --- se define matemáticamente como la distribución de probabilidad inducida por el modelo de ecuación estructural modificado donde la ecuación para X se sustituye por X=x .
Por ejemplo, suponga que su modelo causal está definido por las siguientes ecuaciones estructurales:
Donde las perturbaciones son mutuamente independientes y tienen alguna distribución de probabilidad. Esto corresponde al DAG:
EntoncesP(Y|do(X=x)) es la distribución de probabilidad de Y inducido por las ecuaciones estructurales modificadas:
Que corresponde al DAG mutilado:
El efecto causal promedio sería simplemente la expectativa deY usando el cdf causal P(Y|do(X=x)) .
Esta es la definición matemática, si puede identificar el efecto con datos de observación depende de si puede volver a expresarP(Y|do(X=x)) en términos de la distribución observacional sin el do() operador.
fuente
Un contraejemplo
El problema no parece ser esa independencia media (la condición dondeE[Y|X]=E[Y] ) implica que Y y X no están correlacionados SiX y Y no están correlacionados, generalmente no es cierto que sean independientes de la media. Entonces, esto no parece problemático hasta ahora.
Sin embargo, suponga que tiene una relación (podemos llamarla causal) definida comoY=WX , dónde X se distribuye con una distribución normal estándar y W se distribuye con una distribución Rademacher para que W=1 o −1 , cada uno con probabilidad 1/2 ( ver este artículo de Wikipedia ). Entonces note queE[Y|X]=E[Y] . Según su definición, esta relación no sería causa aunqueY claramente depende de X .
Un ejemplo de una forma formal de pensar sobre la causalidad
Para darle una forma más clara y matemática de ver la causalidad, tome el siguiente ejemplo. (Tomo prestado este ejemplo del libro "Econometría principalmente inofensiva"). Suponga que desea analizar el efecto de la hospitalización en la salud. DefinirYi como alguna medida de salud del individuo i y Di∈{0,1} para indicar si ese individuo fue hospitalizado o no. En nuestro primer intento, supongamos que observamos la diferencia promedio en la salud de los dos tipos de individuos:
Defina el resultado potencial de cualquier individuo de la siguiente manera:
fuente
Revisé su prueba y creo que es correcta (al menos, verifiqué todos los pasos para una definición discreta deE() ) SiE(Y|X)=E(Y) , entonces E(X⋅Y)=E(X)⋅E(Y) . Además, funciona a la inversa.
Sin embargo, no veo dónde está tu problema.
Ejemplo: considere la siguiente tabla:
Los valores son probabilidades, es decirP(X=1∧Y=0)=0.5 Las probabilidades marginales para Y son 0.25, 0.5, 0.25, y 0.5 y 0.5 para X.
Es fácil ver esoE(Y)=E(X)=E(X⋅Y)=0 y eso E(Y|X=−1)=E(Y|X=1)=0 y por lo tanto E(Y|X)=E(X) , por lo tanto, según su definición, las variables no están causalmente relacionadas.
La covarianza es cero porqueE(X⋅Y)=E(X)⋅E(Y) .
Sin embargo, las dos variables no son independientes, porqueP(X=1∧Y=0)=0.5≠0.5⋅0.5=P(X=1)⋅P(Y=0) .
fuente