Digamos que tengo una tabla con las columnas "A", "B"
¿Existe un método estadístico para determinar si "A" hace que suceda "B"? Uno realmente no puede usar la r de Pearson, porque:
- solo prueba la correlación entre valores
- la correlación no es causalidad
- La r de Pearson solo puede correlacionar relaciones lineales
Entonces, ¿qué otras opciones tengo aquí?
correlation
causality
chutsu
fuente
fuente
Respuestas:
Las respuestas y los comentarios hasta ahora son básicamente correctos a nivel práctico, pero para completar, hay investigaciones sobre los llamados modelos de causalidad que se basan en la estadística bayesiana y la teoría de grafos. Entonces, aunque en general la correlación no implica causalidad, existen modelos más complejos que intentan descubrir la causalidad. Vea el libro Causality de Judea Pearl para más detalles, pero esta es una matemática muy pesada y probablemente no sea lo que desea.
fuente
Existen muchos métodos llamados cuasi-experimentales con los que puede discutir de manera creíble sobre la causalidad, aunque sus datos sean observacionales. Estos métodos generalmente se basan en encontrar una fuente de variación exógena en su variable de interés.
Creo que se ofrece una visión general buena y accesible en el libro "Econometría en su mayoría inofensiva". Cubren básicamente todos los métodos cuasi-experimentales en los que las personas (es decir, los economistas) creen (al menos a veces). No cubren los métodos mencionados por ejemplo trb456 (por la misma razón: no muchos creen en ellos).
fuente
Para determinar la causalidad, debe realizar una prueba de aleatorización. Tomas tus temas de prueba y eliges al azar la mitad de ellos para tener calidad A y la otra mitad para no tenerlo. Luego verá si hay una diferencia estadísticamente significativa en la calidad B entre los dos grupos.
Tenga en cuenta que puede ser imposible hacer la prueba de aleatorización que desea hacer. Por ejemplo, ¿cómo podrías probar si ser alto te hace pesar más? Ciertamente, existe una correlación entre la altura y el peso, pero no se puede asignar aleatoriamente un grupo de personas a un grupo "alto" y otro a un grupo "bajo". En este caso, la prueba de aleatorización no se puede hacer.
fuente
Somers 'd trabaja para explicar la relación entre las variables ordinales de una manera que el coeficiente de correlación de Pearson lo hace para los conjuntos de datos.
fuente