Ejemplos reales de correlación confundidos con causalidad

17

Estoy buscando casos específicos y reales en los que una relación causal se dedujo de manera inapropiada de la evidencia de una correlación.

Específicamente, estoy interesado en ejemplos que cumplan con los siguientes criterios:

  • La existencia de la relación causal fue aceptada como un hecho lo suficientemente amplio como para tener efectos notables (en las políticas públicas, el discurso, las decisiones individuales, etc.).
  • El vínculo se infirió únicamente sobre la base de evidencia correlativa (quizás junto con la existencia de un mecanismo causal coherente pero no probado).
  • La causalidad ha sido objetivamente falsificada o al menos llamada a serias dudas.

Los dos ejemplos que me vinieron a la mente no son ideales:

  1. La ingesta de sodio y la presión arterial: según tengo entendido, desde entonces se ha determinado que la ingesta de sal solo aumenta la presión arterial en personas sensibles al sodio. La existencia de una relación causal válida (aunque no la que se aceptó originalmente) hace que este ejemplo sea menos convincente.
  2. Vacunas y autismo: puede que tenga los antecedentes incorrectos, pero creo que este vínculo se supuso sobre la base de correlaciones y evidencia experimental (fraudulenta). Este ejemplo se debilita por el hecho de que existía evidencia directa (falsa).

Nota: He visto esta pregunta similar:

Ejemplos para la enseñanza: correlación no significa causalidad

Mi pregunta difiere principalmente en que se centra en ejemplos notables del mundo real y no en ejemplos en los que un vínculo causal está claramente ausente (por ejemplo, peso y habilidad musical).

Aaron Novstrup
fuente
44
En una gran ciudad en verano, la tasa de asesinatos se correlaciona positivamente con la tasa de consumo de helados.
ttnphns
1
Uno de sus criterios es "La causalidad ha sido objetivamente falsificada o al menos ha sido puesta en duda". OMI que es demasiado fuerte. Una correlación estimada es un estimador sesgado de un efecto causal, suponiendo cierta confusión. En general, las personas están interesadas en las magnitudes de los efectos, no solo en su existencia.
generic_user
1
Además, apuesto a que con un tamaño de muestra lo suficientemente grande, un ECA que asignó aleatoriamente helado en ciudades calientes encontraría un efecto negativo del consumo de helado en la probabilidad de cometer un asesinato.
generic_user
@ACD Chiming acordó hacer explícito que, por supuesto, los ECA todavía tienen amenazas de inferencia causal.
Alexis
1
@ttnphns Ese es un buen ejemplo del tipo que pretendía excluir con mis criterios, a menos que sugiera que una creencia equivocada de que el consumo de helado causa asesinato ha tenido efectos notables en el comportamiento humano. ;-)
Aaron Novstrup

Respuestas:

11

Durante muchos años, los grandes estudios epidemiológicos observacionales interpretados por investigadores que utilizaron los criterios heurísticos de Bradford Hill para inferir la causalidad afirmaron que la terapia de reemplazo hormonal (TRH) en mujeres disminuyó el riesgo de enfermedad coronaria, y fue solo después de que dos ensayos aleatorios a gran escala demostraron que al contrario, esa comprensión clínica y recomendaciones clínicas con respecto a la TRH cambiaron. Este es un cuento clásico de advertencia en epidemiología contemporánea sobre el que puede leer en los libros de texto (por ejemplo, Epidemiología de Leon Gordis ) y en el artículo de Wikipedia sobre la máxima clásica de David Hume .

Dicho esto, los criterios de Bradford Hill no se han entendido como el estado del arte por un buen tiempo ahora, con la inferencia causal contrafáctica ( a la Judea Pearl , Jamie Robbins , Sander Greenland y otros) es el levantador realmente pesado. Es posible hacer inferencias causales razonablemente fuertes sin realizar experimentos aleatorios, utilizando, por ejemplo, variables instrumentales , aleatorización mendeliana , etc. (lo cual es bueno para la ciencia, ya que no podemos realizar experimentos aleatorios en gran parte, si no en la mayoría, del universo )

Alexis
fuente
2
Esta es una gran respuesta y exactamente del tipo que esperaba. Sin embargo, quiero señalar a otros posibles respondedores que un buen ejemplo no necesita referirse a una inferencia hecha por investigadores / estadísticos (y, en particular, no solo aquellos que utilizan los mejores métodos disponibles). Más bien, un ejemplo igualmente bueno podría describir un caso en el que los medios de comunicación, el público o algún otro grupo extrajeron una inferencia causal no válida de la evidencia correlativa (siempre que esta inferencia incorrecta tuviera efectos notables).
Aaron Novstrup
4

No es el tema más glamoroso, pero Nora T. Gedgaudas (Capítulo 18) resume muy bien el cambio en los hallazgos sobre el papel de la fibra en la prevención del cáncer de colon. La fibra, ampliamente pensada durante 25 años como un factor preventivo importante (basado en la correlación), se demostró a través del Estudio de Enfermeras de 16,000 sujetos y 88,000 sujetos como una mera correlación de otros factores que importaron. Estos incluyeron el consumo de frutas y verduras con alto contenido de ciertos nutrientes (que disminuyen el riesgo) y de carnes rojas y especialmente carnes rojas procesadas (que aumentan el riesgo). El autor señala que el mito "parece persistir obstinadamente, sin embargo", incluso entre los médicos. Como suele suceder, una vez que sale la palabra de un patrón, es muy difícil erradicar la idea.

rolando2
fuente
2
Advertencia: los estudios de enfermería también fueron diseños de observación. Si bien no son estrategias para fortalecer la inferencia causal, los datos de estos estudios también se basan en la correlación.
Alexis
Aunque su respuesta dio un buen ejemplo en el que los controles experimentales superaron a los estadísticos, eso no necesariamente cuestiona los controles puramente estadísticos como se usa en otros casos. Creo que aquí los controles estadísticos encajan muy bien.
rolando2
1
Las estadísticas no pueden "controlar" el sesgo causal: esa es una función del diseño del estudio. Cualquier potencial de un factor de confusión se suma a un modelo puede en sí ser confundiendo la relación causal que está tratando de estimar. La inferencia causal a través del diseño del estudio viene a través de la identificación causal (que está garantizada por la asignación aleatoria); Ningún método de estimación o inferencia puede proporcionar eso.
Alexis
3

Pelagra

De acuerdo con este capítulo del libro , la pelagra , una enfermedad caracterizada por mareos, letargo, llagas, vómitos y diarrea severa que había alcanzado proporciones epidémicas en el sur de los Estados Unidos a principios de 1900, se atribuyó ampliamente a un patógeno desconocido sobre la base de un correlación con condiciones de vida insalubres. El Dr. Joseph Goldberger fue instrumental al demostrar experimentalmente que la enfermedad era, de hecho, causada por una dieta deficiente, que (junto con condiciones de vida insalubres) provenía de la pobreza generalizada en el sur postbélum. Su trabajo fue ignorado en gran medida hasta fines de la década de 1930, cuando los investigadores finalmente demostraron que la enfermedad era causada por la falta de niacina.

Entrenamiento de alfabetización ocular

De la misma fuente : se tomó una correlación entre la capacidad de lectura (in) y los movimientos oculares erráticos durante la lectura como evidencia de una relación causal en la dirección equivocada , y se implementaron "programas de entrenamiento del movimiento ocular" para mejorar la alfabetización. Estos fueron ineficaces, y el trabajo posterior demostró que la causalidad corre en la dirección opuesta; Las dificultades de lectura conducen a las regresiones y fijaciones observadas en los lectores pobres.

Aaron Novstrup
fuente
¿Qué tipo de trabajo posterior?
rolando2
@ rolando2 No lo sé, desafortunadamente. Ese capítulo del libro cita "Olsen y Forsberg, 1993" para esa afirmación, que puedo adivinar es este capítulo de Procesos visuales en lectura y discapacidades de lectura . Este documento también respalda el reclamo.
Aaron Novstrup
Si alguien reconoce este libro , por cierto, me gustaría reemplazar el enlace con una cita adecuada. El enlace parece ser de una página de cursos de psicología y es probable que algún día desaparezca.
Aaron Novstrup
1
En líneas similares, se podría mencionar la malaria que, como su nombre indica, se cree que es causada por el mal aire sobre la base de una correlación con las regiones bajas y los pantanos (ver el artículo de Wikipedia en.wikipedia.org/wiki/Malaria )
mdewey