¿Cómo se encuentran las relaciones causales en los datos?

11

Digamos que tengo una tabla con las columnas "A", "B"

¿Existe un método estadístico para determinar si "A" hace que suceda "B"? Uno realmente no puede usar la r de Pearson, porque:

  • solo prueba la correlación entre valores
  • la correlación no es causalidad
  • La r de Pearson solo puede correlacionar relaciones lineales

Entonces, ¿qué otras opciones tengo aquí?

chutsu
fuente
1
No hay. A partir de dichos datos, puede demostrar un alto grado de correlación; no puedes demostrar causalidad.
1
La causalidad no es algo que pueda extraer de los números ... así que repita después de mí: la causalidad no es correlación , la causalidad no es correlación ...
JM no es un estadístico
1
Ver "Causality" de Judea Pearl (ganadora del Premio Turing 2011).

Respuestas:

4

Las respuestas y los comentarios hasta ahora son básicamente correctos a nivel práctico, pero para completar, hay investigaciones sobre los llamados modelos de causalidad que se basan en la estadística bayesiana y la teoría de grafos. Entonces, aunque en general la correlación no implica causalidad, existen modelos más complejos que intentan descubrir la causalidad. Vea el libro Causality de Judea Pearl para más detalles, pero esta es una matemática muy pesada y probablemente no sea lo que desea.


fuente
2

Existen muchos métodos llamados cuasi-experimentales con los que puede discutir de manera creíble sobre la causalidad, aunque sus datos sean observacionales. Estos métodos generalmente se basan en encontrar una fuente de variación exógena en su variable de interés.

Creo que se ofrece una visión general buena y accesible en el libro "Econometría en su mayoría inofensiva". Cubren básicamente todos los métodos cuasi-experimentales en los que las personas (es decir, los economistas) creen (al menos a veces). No cubren los métodos mencionados por ejemplo trb456 (por la misma razón: no muchos creen en ellos).

coffeinjunky
fuente
1

Para determinar la causalidad, debe realizar una prueba de aleatorización. Tomas tus temas de prueba y eliges al azar la mitad de ellos para tener calidad A y la otra mitad para no tenerlo. Luego verá si hay una diferencia estadísticamente significativa en la calidad B entre los dos grupos.

UNAsi

Tenga en cuenta que puede ser imposible hacer la prueba de aleatorización que desea hacer. Por ejemplo, ¿cómo podrías probar si ser alto te hace pesar más? Ciertamente, existe una correlación entre la altura y el peso, pero no se puede asignar aleatoriamente un grupo de personas a un grupo "alto" y otro a un grupo "bajo". En este caso, la prueba de aleatorización no se puede hacer.

Chris Taylor
fuente
0

Somers 'd trabaja para explicar la relación entre las variables ordinales de una manera que el coeficiente de correlación de Pearson lo hace para los conjuntos de datos.

RUresearchteam
fuente
1
Estoy de acuerdo en que se necesita más que números para establecer la causalidad. ¿Cómo entra el uso de variables ordinales en la pregunta?
Michael R. Chernick
1
@MichaelChernick Somers 'D es una medida de asociación asimétrica. Se puede distinguir entre "si está lloviendo, entonces el cielo está nublado,' desde 'si está nublado, entonces está lloviendo' Funciona para datos ordinales o superior que no establece la causalidad, pero sí establece la direccionalidad...
Dave Harris