La correlación no implica causa; pero ¿qué pasa cuando una de las variables es el tiempo?

41

Sé que esta pregunta se ha hecho mil millones de veces, por lo que, después de buscar en línea, estoy completamente convencido de que la correlación entre 2 variables no implica causalidad. En una de mis conferencias de estadísticas de hoy, tuvimos una conferencia invitada de un físico sobre la importancia de los métodos estadísticos en física. Él dijo una declaración asombrosa:

la correlación no implica causalidad, A MENOS QUE una de las variables sea el tiempo. Entonces, si hay una fuerte correlación entre alguna variable independiente y el tiempo, entonces esto también implica causalidad.

Nunca había escuchado esta declaración antes. ¿Los físicos / relativistas ven la "causalidad" de manera diferente a las estadísticas de las personas?

Thomas Moore
fuente
12
Esta es una declaración vaga, y probablemente falsa. El tiempo no causa mucho más que la desintegración radiactiva. El vocabulario tiende a mejorar con la edad, pero está completamente mediado por la socialización y la educación. ¿Puedes describir el contexto y el problema en el que se afirmó esta afirmación?
AdamO
@AdamO Las condiciones para la causalidad son más simples cuando se conoce la precedencia temporal, pero no son tan simples como en esta pregunta.
Neil G
2
Casi parece que están describiendo la causalidad de Granger .
Barker
1
Solo señalando que si realmente quieres saber cómo ven los físicos la causalidad, es más probable que obtengas esas respuestas en Física . Una versión modificada de esta pregunta podría estar en el tema allí.
David Z
2
He oído decir que agregar tiempo a un modelo como una variable independiente solo significa que no ha pasado mucho tiempo tratando de modelar el proceso de generación de datos que produce sus variables dependientes.
Alexis

Respuestas:

37

Proporcionaré otra respuesta, ya que creo que las que se brindan actualmente pierden un punto importante de la declaración que hizo el físico. La declaración citada es:

"la correlación no implica causalidad, A MENOS que una de las variables sea el tiempo. Por lo tanto, si existe una fuerte correlación entre alguna variable independiente y el tiempo, entonces esto también implica la causalidad".

El físico no dice:

"Si X e Y están correlacionados, y X viene antes que Y, entonces la correlación implica causalidad".

Eso sería incorrecto. Lo que el físico está diciendo es:

"Si X y el tiempo están correlacionados, entonces esa correlación implica que el aumento del tiempo provoca un aumento (o disminución) en X".

Un ejemplo podría ser la entropía. Si tenemos una fuerte correlación entre el paso del tiempo y el aumento de la entropía, entonces podríamos decir que el aumento del tiempo provoca un aumento de la entropía. Tenga en cuenta que esto ignora cuáles podrían ser las causas físicas de la entropía creciente (descomposición de partículas, universo en expansión, etc.).

Uno de los requisitos tradicionales para la causalidad es la progresión en el tiempo, es decir, que X solo puede causar Y si X viene antes que Y. Pero si una de sus variables es el tiempo, entonces la progresión en el tiempo ya está integrada en la relación (si existe una relación).

EDITAR: Basado en una variedad de comentarios, voy a agregar lo siguiente. Creo que el físico puede estar usando una idea diferente de la palabra "causalidad" aquí. Parece estar diciendo que si hay una correlación entre una variable independiente y el tiempo, se puede concluir que la variable independiente cambia previsiblemente a medida que pasa el tiempo. Algunas personas podrían decir que los cambios son "causados" por el paso del tiempo, esto no es realmente cómo los estadísticos usan las palabras "causa" o "causalidad", por lo que puede estar causando algo de confusión.

Duncan
fuente
3
+1 Exactamente, así es como interpreté la declaración también (ver mis comentarios y respuestas anteriores)
Ruben van Bergen
55
Si va a hacer del tiempo una variable en su modelo gráfico, entonces el tiempo no tiene causas y es la causa de todo. Por lo tanto, es una afirmación vacía sugerir que el tiempo causa algo en particular ya que el tiempo lo causa todo.
Neil G
2
Vacío o no, esta es la interpretación que parece coherente con lo que supuestamente dijo el físico. No dispares al mensajero;). Además, creo que vale la pena destacar si el propósito es educar a las personas sobre la relación entre correlación y causalidad, incluso si piensas que es trivial considerar que el tiempo realmente causa cosas en la práctica.
Ruben van Bergen
66
@ GeoMatt22 - No estoy de acuerdo con la idea de "el tiempo lo hace todo". Considere lanzar una moneda varias veces, incluso si la lanzo durante horas, todavía debería obtener una proporción de 1/2 cara de cara, por lo que el tiempo no "causa" la probabilidad de que la cara suba o baje. Coloque un cubito de hielo en una habitación y su temperatura aumentará y se derretirá con el paso del tiempo; el tiempo "causa" el equilibrio de temperatura en este caso. Este puede ser un sentido diferente de la palabra "causa" que usan los estadísticos, pero creo que es una interpretación funcional desde la perspectiva de la física.
Duncan
66
El punto es que nunca considerarías una estructura gráfica por la cual cualquier variable cause el paso del tiempo. Por lo tanto, la única estructura gráfica es que el tiempo es la causa de todas las demás variables. Puede que no tenga absolutamente ninguna influencia sobre ellos (como en su ejemplo), pero las flechas causales son afirmaciones sobre la estructura gráfica causal, lo que implica relaciones de independencia condicional dadas observaciones e intervenciones . La fuerza de la influencia es una pregunta separada.
Neil G
15

No sabemos a qué se refería el físico. Siguen dos interpretaciones diferentes.


La afirmación de que precede a y está correlacionada con implica que causa que está mal. No es suficiente para e sean dependientes, incluso si precede a . Por ejemplo, y Y ambos pueden ser causados por alguna otra variable W : X W Y . O podría surgir un patrón aún más complicado: X V Z W Y donde ZY Y X Y X Y X Y XXYYXYXYXYXYWXWYXVZWYZes observado. Ahora e Y son dependientes y no tienen una causa común, pero ninguna causa la otra.XY

Sin embargo, la precedencia temporal simplifica enormemente las condiciones para afirmar una relación causal, que puede encontrar en el capítulo 2.7 del libro de Causalidad de Pearl, "Criterios locales para las relaciones causales".

Una variable tiene una influencia causal en Y si hay una tercera variable Z y un contexto S , ambos antes de X , de modo que:XYZSX

  1. (Z⊥̸YS)
  2. (ZYSX)

Esencialmente, (1) implica que es una causa potencial de dada la precedencia temporal, y (2) implica que es capaz de romper esa relación, que sólo puede ocurrir si causa .ZYXXY

Esta condición es mucho más simple que la definición de Pearl para una causa genuina sin información temporal.


Otra posibilidad se describe en algunas de las otras respuestas es que el físico significaba que si es el paso del tiempo y se correlaciona con , entonces causa . Esta afirmación es correcta, pero vacía ya que el paso del tiempo es la causa de todas las demás variables, con lo que quiero decir que la estructura gráfica causal es así. Una estructura gráfica causal es un conjunto de afirmaciones sobre las relaciones de independencia dadas observaciones e intervenciones.XYXY

Neil G
fuente
2
Como mencioné en los comentarios a la respuesta de GeoMatt22, no creo que la declaración del físico tenga nada que ver con precedencia.
Ruben van Bergen
2
@RubenvanBergen Como expliqué en otra respuesta, esa interpretación es vacía. El tiempo lo causa todo.
Neil G
En su ejemplo, , e serían dependientes, pero no correlacionados (a menos que y estén correlacionados a través de una conexión que no especificó). XVZWYXYVW
Ruben van Bergen
@RubenvanBergen Podrían estar correlacionados. Depende de la naturaleza de las dependencias. Por cierto, dije que e son dependientes dado observado. XYZ
Neil G
1
@RubenvanBergen Creo que estás malinterpretando las flechas. Estos son flechas causales, y la información puede fluir desde a debido a explicar de distancia en . Considere que es "Lluvia", es "El rociador está apagado", es tierra mojada, es el sonido de la lluvia e es un indicador de que el rociador está apagado. Ahora que el suelo está mojado, se correlaciona con debido a la explicación. VWZVWZXYXY
Neil G
10

Supongo que su profesor invitado quiso decir que en física las únicas correlaciones que sobreviven a la replicación son aquellas en las que existe una relación causal subyacente. La variable de tiempo es una excepción porque es la única variable que no está controlada por el físico. Este es el por qué.

En física, usualmente tratamos con fenómenos y experimentos repetibles. De hecho, es casi un hecho que cualquier experimento es repetible y puede ser replicado por usted más tarde o por otros investigadores. Entonces, supongamos que observa una muestra donde son observaciones de la variable de interés y variables independientes . Como mencioné anteriormente, controlamos completamente las variables , y podemos establecerlas en cualquier valor que deseemos.yi,xkixkxk

Su físico dice que en esta configuración no verá ninguna correlación menos que haya un vínculo causal. ¿Por qué? Porque alguien más o incluso usted mismo repetirá el experimento con cualquier combinación y secuencia de , y solo las correlaciones con las relaciones causales sobrevivirán a las réplicas de un experimento. Todas las demás correlaciones (espurias) desaparecerán una vez que recopile suficientes datos en todas las combinaciones posibles de un experimento.Corr[y,xk]xkj

Esta situación está en marcado contraste con las ciencias sociales y algunas aplicaciones empresariales en las que no puedes hacer experimentos. Usted observa solo una secuencia del PIB de un país, y no puede cambiar el desempleo manteniendo todo lo demás igual y observar las correlaciones.

Ahora, el tiempo es la única variable que un físico no puede controlar. Solo hay un 1 de enero de 2017. No puede repetir este día. Puede repetir cualquier otra variable, pero no el tiempo. Es por eso que cuando se trata de tiempo ( no de tiempo o edad transcurrido), un físico está en el mismo barco que todos los demás: la correlación no implica causalidad para él.

Aksakal
fuente
5

No he escuchado esto antes, y no sería cierto según las concepciones de causalidad con las que estoy familiarizado (aunque no soy físico).

Típicamente, para que cause , es necesario que preceda a a tiempo. Entonces, si precede a entonces no puede ser "causado" por , independientemente de cualquier correlación. Además, precede a no es una condición suficiente para la causalidad (también independientemente de cualquier correlación).XYXYYXXXY

GeoMatt22
fuente
1
Creo que no entiendes lo que este físico quería decir. Creo que se referían a una situación en la que dos variables están correlacionadas entre sí, y una de estas variables es el tiempo. Supone que ninguna de las variables es el tiempo, pero que donde entra el tiempo es que una variable precede a la otra.
Ruben van Bergen
3
Estaba tratando de indicar que el paso del tiempo generalmente se requiere para que algún cambio en sea ​​"causado" por algo, pero una correlación de vs. no se suele hablar de "causalidad" (a es necesario pero no suficiente). Tenía la intención de comunicar que no sé si esto es lo que el físico quiso decir o no. Me imagino que un físico típicamente diría "la disminución del carbono 14 a través del tiempo es causada por la desintegración radiactiva " en lugar de "... causada por el paso del tiempo". (Aunque tal vez " requiere el paso del tiempo".)YYttΔt
GeoMatt22
¿@RubenvanBergen quizás el profesor estaba tratando de expresar una versión simplificada de algo como lo que Wikipedia parece llamar " estructura causal "? La correlación con el tiempo (en escalas suficientemente finas) implicaría diferenciabilidad en la "dirección del tiempo". Puede que lo esté interpretando mal, pero la lectura de Wikipedia sugiere un uso similar al que escribí anteriormente: "estructura causal" define lo que significa "precede". Pero todavía me parece "necesario pero no suficiente".
GeoMatt22
Solo voy por la cita en la pregunta: "la correlación no implica causalidad, A MENOS que una de las variables sea el tiempo. Entonces, si hay una fuerte correlación entre alguna variable independiente y el tiempo, entonces esto también implica la causalidad". Para mí, esto implica que tenemos alguna variable X que se correlaciona con el tiempo. Llegamos a la conclusión de que el paso del tiempo causa X, en lugar de que X causa el paso del tiempo, porque este último no tiene sentido.
Ruben van Bergen
4

No creo que el tiempo sea necesariamente único en esto, pero ciertamente es un buen ejemplo. El punto es que, por lo general, si A y B están correlacionados, se puede suponer que existe una causalidad común, pero no se sabe si A causa B o B causa A, o quizás una tercera variable C causa ambos A y B. Sin embargo, , en ciertos casos, puede descartar que cualquier otra variable haya causado A, por lo que debe ser que A haya causado B. Un ejemplo de ello es un experimento controlado, donde usted , el experimentador, controla A. Luego, si el cambio que realiza A "se correlaciona" con un cambio en B, sabes que debe haber sido A lo que causó que B cambiara, no al revés.

Otro tipo de escenario, en el que se encuentra este ejemplo con el tiempo, es si simplemente sabe que ninguna otra variable podría haber causado A porque sabe que nada puede influir en A. Ya que el tiempo solo fluye un segundo a la vez independientemente de cualquier otra variable en el mundo, entonces si el tiempo se correlaciona con cambios en alguna variable que le interese (por ejemplo, la cantidad de personas en el planeta), usted sabe con certeza que el paso del tiempo debe haber causado que esa variable cambie, más bien que su variable causando que el tiempo pase o cambie (es decir, el tiempo no avanzó porque nacieron más personas, tiene que ser al revés).

Lo que todavía no sabes, por supuesto, es si la causalidad es directa. Presumiblemente, el paso del tiempo en sí no produce automáticamente más seres humanos. Más bien, el desarrollo de la historia causa progreso en varios aspectos de la sociedad, y esto hace que la población aumente de tamaño (e incluso eso es una simplificación de muchas pequeñas relaciones causales). Pero independientemente de los factores precisos en juego, definitivamente sabes que A (en última instancia) conduce a B y no al revés.

Ruben van Bergen
fuente
En su primer párrafo, sus tres casos no son exhaustivos. Existen otras estructuras gráficas compatibles con la correlación.
Neil G
El descarte de todas las demás variables que causan no es posible para ningún problema realista. Hay un método por el cual descarta un flujo de información a través de causas de que conducen a , que se llama el método de puerta trasera . Esto puede establecer la causalidad. AAB
Neil G
1
Como dije en otra respuesta, la idea de interpretar "el paso del tiempo" como variable y afirmar que debe ser la causa de alguna otra variable es vacía. Esta variable de tiempo es la causa de todo.
Neil G
En términos generales, estoy bastante seguro de que las opciones que enumeré son todas las posibilidades. Podemos tener A causando B o B causando A (directa o indirectamente), o podemos tener algo más causando A y B. Por supuesto, también son posibles combinaciones de estos, donde, por ejemplo, A tiene algún efecto causal sobre B, pero en Al mismo tiempo, un tercer factor C también afecta causalmente tanto a A como a B. Y luego supongo que hay una coincidencia como otra opción, pero eso es aburrido. Pero me gustaría saber si hay otras posibilidades.
Ruben van Bergen
1
Mira mi respuesta. Ilustré un cuarto caso, aunque hay muchos más casos.
Neil G
4

En realidad, la correlación implica una relación causal.

Quizás A causó B, o C causó A y B.

Sin embargo, la correlación no prueba la causalidad.

Esto es evidente por sí mismo.

L1-A
fuente
55
Un vistazo a las respuestas y comentarios sugiere que la conversación aquí ha ido mucho más allá de tales trivialidades. Recomiendo revisar algunas de las publicaciones como ayuda para apreciar los problemas.
whuber
3

Interpretaría esto como un argumento semántico en lugar de matemático / estadístico. También lo tomaría como una generalización bastante severa.

Los Criterios de Bradford Hill , de uso frecuente en epidemiología, proporcionan un buen marco para pensar sobre la causalidad. Nada puede probar definitivamente la causalidad, ya sea que el tiempo sea o no un factor, y sospecho que el profesor no estaba tratando de hacer una afirmación tan fuerte. Sin embargo, se pueden usar muchos factores diferentes como argumentos razonables para la causalidad.

Por ejemplo, los criterios de Bradford Hill sugieren que la fuerza de asociación entre variables puede proporcionar evidencia de causalidad, pero no es suficiente por sí sola. De manera similar, una asociación que sea consistente con otros hechos conocidos / creídos puede sugerir una causalidad más fuerte que una asociación que sea inconsistente con el conocimiento prevaleciente. La temporalidad es también uno de los criterios: una causa debe preceder a su efecto. Una asociación y las inferencias que hacemos sobre la causalidad deben tener sentido temporal. Recomiendo revisar los otros criterios. Algunos son específicos de la epidemiología y no son tan aplicables a la física, pero sigue siendo una forma útil de pensar.

El punto principal es que, si bien ninguna pieza de evidencia probará definitivamente la causalidad, puede construir un buen caso para ello en función de una serie de verificaciones lógicas diferentes. Yo diría que dar prioridad absoluta a cualquier criterio, como el tiempo, no es apropiado, pero la temporalidad puede ser un factor importante cuando se hace un caso de que la causalidad es plausible.

Esto lleva a un punto más amplio acerca de las estadísticas: en términos generales, usamos estadísticas para hacer un argumento. Utilizamos datos y herramientas estadísticas para hacer un cierto punto. A menudo, se pueden usar los mismos datos (e incluso las mismas herramientas) para hacer puntos en conflicto. No podemos ubicar la prueba definitiva de la causalidad en las matemáticas en sí, pero podemos implementar nuestras herramientas estadísticas como parte de un argumento más amplio. Para más información sobre eso, recomiendo las estadísticas de Abelson como argumento basado en principios.

Para regresar a la situación original, supongamos que ha realizado un experimento sobre el efecto de la concentración de un determinado producto químico en una solución sobre la temperatura de esa solución. Sospecha que agregar más de esta sustancia química provocará una reacción que aumenta la temperatura. Agrega más gradualmente con el tiempo. Puedes mirar la temperatura contra el tiempo y ver un aumento. Todo lo que muestra es que la temperatura aumenta con el tiempo; no prueba que el tiempo mismo (o cualquier otra cosa) tenga algún efecto causal. Sin embargo, proporciona alguna evidencia en un argumento más amplio de que una mayor concentración de este producto químico da como resultado una reacción que aumenta la temperatura.

djlid
fuente
Es un pensamiento peculiar aplicar el criterio de Hill de "precedencia temporal" a una exposición del tiempo mismo. Ciertamente, el tiempo precedió al tiempo mismo. Las tendencias, como sabemos, rara vez son causales, pero reflejan otros fenómenos simultáneos . En este ejemplo, no creo que el tiempo haya causado nada, sino que resumió los cambios globales en los entornos que afectaron tanto la exposición como el resultado.
AdamO
No estoy argumentando que aplicamos el argumento al tiempo en sí mismo, sino que digo que, si tenemos tiempo como parte de nuestros datos, podemos usarlo para formar parte de un argumento más amplio de causalidad. Al demostrar que nuestras observaciones tienen sentido temporal, estamos más cerca de tener un argumento causal razonable. Con suerte, tendríamos mucho más que eso para trabajar para crear un argumento más fuerte.
djlid
3

La oración es bastante simple y no vale la pena pensar demasiado (y no tiene nada que ver con la precedencia).

Si existe una correlación establecida entre una variable y el tiempo (es decir, sabemos que un aumento en el tiempo va acompañado de un aumento en la variable, y esto es un hecho ), entonces conocemos la dirección "causal": es decir, el aumento del tiempo causa La variable a aumentar.

Debido a que la hipótesis alternativa de "nah-uh, podría ser que el tiempo solo aumentara porque la variable aumentó primero " simplemente no puede sostenerse dada la forma en que funciona el tiempo.


Esto puede sonar como una observación tonta, pero tiene implicaciones importantes para el diseño del estudio que trata de probar una dirección causal. Un ejemplo importante en medicina es la diferencia entre hacer un estudio transversal y un estudio de cohorte.

Por ejemplo, un estudio transversal que intenta encontrar un vínculo entre fumar y el cáncer podría incluir a un grupo de personas, dividirlo en fumadores versus no fumadores, y ver cuántos en cada grupo tienen cáncer y no cáncer. Sin embargo, esta es una evidencia débil porque una correlación entre fumar y el cáncer también podría interpretarse como "las personas que tienen cáncer tienen más probabilidades de disfrutar de fumar".

Sin embargo, si realiza un estudio de cohorte, es decir, tome un grupo de fumadores y un grupo de no fumadores, realice un seguimiento a lo largo del tiempo y mida la variable "cáncer en fumadores menos cáncer en no fumadores" y establezca un resultado positivo. correlación de esta variable con el tiempo (bajo suposiciones razonables, de modo que la cantidad de fumadores una vez que comienza es constante e independiente del tiempo, etc.), entonces sabe que el "tiempo" es la causa de la diferencia del cáncer, ya que no puede afirmar que las tasas de cáncer aumentan causó que pasara más tiempo en el grupo de fumadores. Por lo tanto, puede reclamar una causa entre el paso del tiempo y una diferencia positiva de cáncer relacionada con tasas más altas en el grupo de fumadores. (o, dicho de manera más simple, el tiempo dedicado al grupo de fumadores causa un aumento proporcional en el riesgo de cáncer).

Además, la debilidad del estudio transversal, es decir, la posibilidad de que "las personas con cáncer sean más propensas a fumar" ahora se ha ido por la ventana, ya que fumar como variable se ha eliminado del "tiempo frente al cáncer" ecuación (aquí se supone que es constante y, por lo tanto, no se ve afectada por el tiempo). En otras palabras, al formular el estudio de esta manera, hemos examinado una dirección causal muy específica . Si quisiéramos examinar hasta qué punto se aplica la dirección causal inversa (es decir, qué tan probable es que las personas que eventualmente contraerán cáncer dejen de fumar a medida que pasa el tiempo), entonces necesariamente tendríamos que diseñar un estudio de cohorte dividido en "cáncer futuro versus cáncer no futuro" y mide la absorción del tabaquismo con el tiempo.

Actualización respondiendo a los comentarios:

Tenga en cuenta que esta es una discusión sobre una dirección causal en lugar de encontrar un vínculo causal directo. La cuestión de la confusión es otra. (es decir, no hay nada que sugiera que no es una organización independiente tercera variable que tanto lo hace más propenso a ser un fumador y aumenta sus posibilidades de cáncer con el tiempo). Es decir, en términos de causalidad contrafáctica, no hemos demostrado definitivamente que "si no hubiera sido por fumar, estas personas no hubieran contraído cáncer". Pero nosotros tenemosmostró que "la asociación entre el grupo de fumadores y el cáncer no habría aumentado si el tiempo no hubiera pasado". (es decir, la asociación no se reduce a una instantánea de los pacientes con cáncer, la mera preferencia por estar en el grupo de fumadores o no, sino que se fortalece con el tiempo).

Tasos Papastylianou
fuente
44
"Por lo tanto, puede reclamar una causa entre el paso del tiempo y el desarrollo de más cáncer en virtud de ser un fumador (o, dicho de manera más simple, el tiempo dedicado a fumar causa un aumento proporcional en el riesgo de cáncer)". - No, no puedes hacer eso. Las compañías de cigarrillos respaldadas por Sir Ronald Fisher (!) Argumentaron durante años que la predisposición genética era una posible causa común de tabaquismo y cáncer. Este mismo ejemplo está en la parte posterior del libro de Pearl (p. 353).
Neil G
@NeilG no, mantengo mi ejemplo tal como está formulado. El punto que está haciendo no es uno de causalidad inversa, sino de confusión. Mi ejemplo, tal como está, muestra que el tiempo pasado en el grupo de fumadores está asociado con un aumento en las tasas de cáncer. Pero esto en sí mismo no prueba que la "predisposición genética" no sea la fuerza impulsora detrás del aumento de las tasas en el grupo de fumadores. Dos cosas diferentes El punto aquí es que la introducción de la dirección causal como una variable de tiempo erradica el argumento de "causalidad inversa" (es decir, el cáncer hace que empiece a fumar), pero no el de "confusión".
Tasos Papastylianou
1
Su comentario es correcto, pero no parece coherente con lo que escribió. Usted escribió que "el tiempo dedicado a fumar causa un aumento proporcional en el riesgo de cáncer". Eso no está justificado.
Neil G
1
@NeilG es justo, tienes razón. No esperaba tal escrutinio, jaja. Lo reformularé con un poco más de precisión.
Tasos Papastylianou
¿Por qué es necesariamente el caso de que el avance del tiempo no es causado? ¿Cómo podemos descartar de manera tan concluyente la posibilidad de que haya algo que haga que el tiempo avance? Eso me parece una afirmación muy extraordinaria que requeriría pruebas excepcionalmente sólidas.
David Schwartz
3

Esta es realmente una cuestión de cómo establecer la causalidad, porque los eventos que están relacionados pero no causativos probablemente estarán correlacionados en el tiempo o el espacio. Entonces, mirando algunos datos correlacionados, ¿cómo podemos determinar si la relación es dependiente? Un sabio asesor de investigación me dijo una vez: "la correlación no implica causalidad, solo te dice dónde buscar".

Consideremos la situación en la que se encuentra que los eventos A y B están correlacionados temporal o espacialmente. Si quisiéramos investigar la preposición de que A causa B , la línea de pensamiento tradicional es introducir pruebas de necesidad y suficiencia , que es lo que realmente significa la causalidad.

  • Si la ausencia del evento A conduce a la ausencia del evento B , se puede llamar necesario .
  • Si solo el evento A solo conduce al evento B , se puede llamar suficiente .

Si no tener leche me hace ir a la tienda , lo que estamos diciendo es que no me meto en la leche vacía y conduzco. La causalidad absoluta significaría que cada vez que todavía tengo leche , no me molestan en ir a la tienda; y por el contrario cada vez que estoy en la tienda, es porque no tengo leche. Ahora es fácil ver el problema de establecer positivamente la causalidad en el sentido riguroso: la mayoría de las cosas no son absolutamente causales. Hay muchas otras razones por las que podría ir a la tienda que no están relacionadas con el estado de la leche.

Esta es una manera fácil de distinguir un gran papel de un papel correcto. En una investigación cuidadosa, verá pruebas de suficiencia y necesidad en todas partes. ¿Hacer la afirmación de que el fármaco A de molécula pequeña puede conducir al desmontaje del complejo proteico B? Inmediatamente verá las pruebas:

necesidad ----test---- ----result---- everything but B --> [nothing] (check for false positive) everything but A --> assembled everything with A-like compound --> assembled (control group)

suficiencia A + B alone (in vitro) --> disassembled (check for false negative) A + B + everything --> disassembled (trial group)

Esta es la forma tradicional en la que construiría un argumento inductivo para la causalidad USANDO experimentalmente la correlación, ¡eso es lo que estoy seguro de que su profesor estaba eludiendo!

jdbiochem
fuente
1
Solo para enfatizar el punto, la dependencia del tiempo tampoco implica causalidad. Podemos tener ese evento A que conduce al evento B a menudo y es B el que causa C y no A. Sin embargo, A estará correlacionado con C pero no lo causará.
Michael Chernick