La correlación no implica causalidad, ya que podría haber muchas explicaciones para la correlación. ¿Pero la causalidad implica correlación? Intuitivamente, pensaría que la presencia de causalidad significa que necesariamente hay alguna correlación. Pero mi intuición no siempre me ha servido bien en estadística. ¿La causalidad implica correlación?
correlation
causality
Mateo
fuente
fuente
Respuestas:
Como han dicho muchas de las respuestas anteriores, la causalidad no implica una correlación lineal . Dado que muchos de los conceptos de correlación provienen de campos que dependen en gran medida de estadísticas lineales, por lo general, la correlación se considera igual a la correlación lineal. El artículo de Wikipedia es una buena fuente para esto, realmente me gusta esta imagen:
Mire algunas de las figuras en la fila inferior, por ejemplo, la forma de parábola en el cuarto ejemplo. Esto es lo que sucede en la respuesta @StasK (con un poco de ruido agregado). Y puede ser completamente causado por X, pero si la relación numérica no es lineal y simétrica, aún tendrá una correlación de 0.
La palabra que está buscando es información mutua : esta es una especie de versión general no lineal de correlación. En ese caso, su afirmación sería verdadera: la causalidad implica una alta información mutua .
fuente
La respuesta estricta es "no, la causalidad no necesariamente implica correlación".
Considere e . La causalidad no hay nada más fuerte: determina . Sin embargo, la correlación entre e es 0. Prueba: Los momentos (conjuntos) de estas variables son: ; ; usando La propiedad de la distribución normal estándar de que sus momentos impares son todos iguales a cero (por ejemplo, puede derivarse fácilmente de su función generadora de momentos). Por lo tanto, la correlación es igual a cero.X∼N(0,1) Y=X2∼χ21 X Y X Y E[X]=0 E[Y]=E[X2]=1
Para abordar algunos de los comentarios: la única razón por la que este argumento funciona es porque la distribución de está centrada en cero y es simétrica alrededor de 0. De hecho, cualquier otra distribución con estas propiedades que tendría un número suficiente de momentos habría funcionado en lugar de , por ejemplo, uniforme en o Laplace . Un argumento demasiado simplificado es que para cada valor positivo de , hay un valor negativo igualmente probable de de la misma magnitud, por lo que cuando cuadras la , no puedes decir que valores mayores de están asociados con valores mayores o menores. deN ( 0 , 1 ) ( - 10 , 10 ) ∼ exp ( - | x | ) X X X X YX N(0,1) (−10,10) ∼exp(−|x|) X X X X Y X∼N(3,1) E[X]=3 E[Y]=E[X2]=10 E[X3]=36 Cov[X,Y]=E[XY]−E[X]E[Y]=36−30=6≠0 X −X X Y χ2
fuente
Básicamente sí.
La correlación no implica causalidad porque podría haber otras explicaciones para una correlación más allá de la causa. Pero para que A sea una causa de B , deben estar asociados de alguna manera . Lo que significa que existe una correlación entre ellos, aunque esa correlación no necesariamente tiene que ser lineal.
Como algunos de los comentaristas han sugerido, es probable que sea más apropiado usar un término como 'dependencia' o 'asociación' en lugar de correlación. Aunque, como he mencionado en los comentarios, he visto que "correlación no significa causalidad" en respuesta al análisis mucho más allá de la simple correlación lineal, y por lo tanto, a los efectos del dicho, esencialmente he extendido la "correlación" a cualquier asociación entre A y B.
fuente
Agregando a la respuesta de @EpiGrad. Creo que, para mucha gente, "correlación" implicará "correlación lineal". Y el concepto de correlación no lineal podría no ser intuitivo.
Entonces, yo diría "no, no tienen que estar correlacionados, pero sí tienen que estar relacionados ". Estamos de acuerdo con la sustancia, pero no estamos de acuerdo con la mejor manera de transmitirla.
Un ejemplo de tal causalidad (al menos la gente piensa que es causal) es la probabilidad de contestar su teléfono e ingresos. Se sabe que las personas en ambos extremos del espectro de ingresos tienen menos probabilidades de responder sus teléfonos que las personas en el medio. Se cree que el patrón causal es diferente para los pobres (por ejemplo, evitar los cobradores de facturas) y los ricos (por ejemplo, evitar que las personas soliciten donaciones).
fuente
Considere el siguiente modelo causal:
Ahora deja:
En resumen, diría que: (i) la causalidad sugiere dependencia; pero, (ii) la dependencia es funcional / estructural y puede o no traducirse en la dependencia estadística específica en la que está pensando.
fuente
La causa y el efecto estarán correlacionados a menos que no haya variación en absoluto en la incidencia y magnitud de la causa y no haya variación en absoluto en su fuerza causal. La única otra posibilidad sería si la causa está perfectamente correlacionada con otra variable causal con exactamente el efecto contrario. Básicamente, estas son condiciones de experimento mental. En el mundo real, la causalidad implicará dependencia de alguna forma (aunque podría no ser una correlación lineal ).
fuente
Hay excelentes respuestas aquí. Artem Kaznatcheev , Fomite y Peter Flom señalan que la causalidad generalmente implicaría dependencia en lugar de correlación lineal. Carlos Cinelli da un ejemplo donde no hay dependencia, debido a cómo se configura la función generadora.
Quiero agregar un punto sobre cómo esta dependencia puede desaparecer en la práctica, en los tipos de conjuntos de datos con los que bien podría trabajar. Situaciones como el ejemplo de Carlos no se limitan a meras "condiciones de experimento mental".
Las dependencias desaparecen en los procesos de autorregulación . La homeostasis, por ejemplo, asegura que la temperatura interna de su cuerpo permanezca independiente de la temperatura ambiente. El calor externo influye directamente en la temperatura de su cuerpo, pero también influye en los sistemas de enfriamiento del cuerpo (por ejemplo, sudoración) que mantienen estable la temperatura corporal. Si tomamos muestras de temperatura en intervalos extremadamente rápidos y utilizamos mediciones extremadamente precisas, tenemos la posibilidad de observar las dependencias causales, pero a tasas de muestreo normales, la temperatura corporal y la temperatura externa parecen independientes.
Los procesos autorreguladores son comunes en los sistemas biológicos; son producidos por la evolución. Los mamíferos que no logran regular su temperatura corporal son eliminados por selección natural. Los investigadores que trabajan con datos biológicos deben ser conscientes de que las dependencias causales pueden desaparecer en sus conjuntos de datos.
fuente
¿No sería una causa sin ninguna correlación un rng?
A menos que, como implica la respuesta aceptada, esté utilizando una interpretación increíblemente limitada de la palabra 'correlación', es una pregunta tonta: si una cosa 'causa' a otra, por definición se ve afectada de alguna manera, ya sea aumento de la población, o solo intensidad.
¿derecho?
Por otra parte, podría estar discutiendo algo más parecido, la visibilidad de algo afectado por otra cosa, lo que supongo que parecería causalidad, pero realmente no está midiendo lo que cree que está midiendo ...
Entonces sí, supongo que la respuesta corta sería: "Sí, siempre y cuando no puedas crear entropía".
fuente