¿Es la correlación equivalente a la asociación?

27

Mi profesor de estadística afirma que la palabra "correlación" se aplica estrictamente a las relaciones lineales entre variables, mientras que la palabra "asociación" se aplica ampliamente a cualquier tipo de relación. En otras palabras, afirma que el término "correlación no lineal" es un oxímoron.

Por lo que puedo hacer de esta sección en el artículo de Wikipedia sobre " Correlación y dependencia ", el coeficiente de correlación de Pearson describe el grado de "linealidad" en la relación entre dos variables. Esto sugiere que el término "correlación" de hecho se aplica exclusivamente a las relaciones lineales.

Por otro lado, una búsqueda rápida en Google de " correlación no lineal " arroja una serie de artículos publicados que usan el término.

¿Es correcto mi profesor o "correlación" es simplemente sinónimo de "asociación"?

Asad Saeeduddin
fuente
1
Por el contrario, también existe una 'asociación lineal'.
Bogdanovist

Respuestas:

37

No; La correlación no es equivalente a la asociación. Sin embargo, el significado de la correlación depende del contexto.

La definición estadística clásica es, para citar de la Enciclopedia de Ciencias Estadísticas de Kotz y Johnson, "una medida de la fuerza de la relación lineal entre dos variables aleatorias". En estadística matemática, la "correlación" parece tener generalmente esta interpretación.

En las áreas aplicadas donde los datos son comúnmente ordinales en lugar de numéricos (por ejemplo, psicometría e investigación de mercado), esta definición no es tan útil ya que el concepto de linealidad asume datos que tienen propiedades de escala de intervalo. En consecuencia, en estos campos, la correlación se interpreta como una indicación de un patrón bivariado que aumenta o disminuye monotónicamente, o una correlación de los rangos. Se han desarrollado una serie de estadísticas de correlación no paramétricas específicamente para esto (por ejemplo, la correlación de Spearman y la tau-b de Kendall). A veces se les denomina "correlaciones no lineales" porque son estadísticas de correlación que no asumen linealidad.

Entre los no estadísticos, la correlación a menudo significa asociación (a veces con y otras sin connotación causal). Independientemente de la etimología de la correlación, la realidad es que entre los no estadísticos tiene este significado más amplio y es probable que ninguna cantidad de castigo por un uso inapropiado cambie esto. He hecho un "google" y parece que algunos de los usos de la correlación no lineal parecen ser de este tipo (en particular, parece que algunas personas usan el término para denotar una relación no lineal uniforme entre variables numéricas) .

La naturaleza dependiente del contexto del término "correlación no lineal" tal vez significa que es ambiguo y no debe usarse. Con respecto a la "correlación", debe determinar el contexto de la persona que usa el término para saber lo que significan.

Tim
fuente
66
+1 Una respuesta reflexiva y bien informada. Por favor considere calificar el "no" inicial porque toma un poco de lectura y pensamiento para entender si significa "no, el profesor no es correcto" o "no, 'correlación' no es sinónimo de 'causalidad'", o La conjunción de los dos.
whuber
Gracias por el comentario; He editado mi respuesta en consecuencia.
Tim
1
Esta es una excelente respuesta (y pregunta) que tiene algunos problemas más amplios sobre terminología, lenguaje y comunicación en general que todos debemos tener en cuenta.
Peter Ellis
3
Entonces, ¿qué es la asociación?
Ovejas
5

No veo mucho sentido tratar de desenredar los términos "correlación" y "asociación". Después de todo, el propio Pearson (y otros) desarrollaron una medida de relación no lineal que denominaron " relación de correlación ".

usuario28193
fuente
1
Sí, parece que en este punto son bastante difíciles de desenredar, especialmente dada la historia (por ejemplo, como usted menciona) y la percepción social.
Behacad
2

Parece haber malentendidos de asociación. Las medidas de asociación (tamaño del efecto) son inherentes al análisis cuantitativo, no cualitativo.

Scott Howell
fuente
1
Tal vez deberías pensar en convertir eso en un comentario. Las respuestas suelen ser un poco más largas
PhDing
@Alessandro Sí, se necesita más para una respuesta, pero el OP no tiene suficiente reputación (> +50) para comentar todavía. Quizás el moderador pueda convertirlo en un comentario para él.
Carl
0

Yo diría que la correlación se aplica a los datos cuantitativos y la asociación a los datos cualitativos y ambos no tienen una relación causal obligatoria.

Jean Turgeon
fuente
¿Qué quiere decir con "asociación con datos cualitativos"?
Randel
0

La idea de que el peso (de un hombre) no está correlacionado con la altura (porque la función correspondiente es de 3er grado, no lineal) me parece muy extraña. La correlación lineal debe tratarse como un caso especial de asociación.

Krzysztof Szymanek
fuente
1
Pero, ¿contra qué (o de quién) idea estás discutiendo? La correlación se puede calcular aquí como (b) correlación entre los valores observados y pronosticados de cualquier combinación de términos, así como (presumiblemente) (a) correlación no nula entre el peso y la altura.
Nick Cox
-1

La correlación y la asociación son diferentes. La correlación describe los tres tipos de relación positiva, negativa y no correlacionada. También describe la magnitud de la correlación de 0 a 1, de -1 a 0. La asociación no revela qué tipos de asociación y cuánta asociación.

Rabindra Ghimire
fuente
¿Cuál es la pregunta aquí?
Christoph Hanck
Como no define la asociación ni explica cómo difiere, es difícil ver por qué cree que respondió la pregunta. Esto no se suma a las respuestas anteriores.
Nick Cox
-2

En cuanto a la linealidad, la respuesta de Tim y Nick Cox la cubrió por completo. Donde pensé que podría contribuir es una forma clara de pensar sobre la diferencia entre asociación y correlación.

Asociación --- mide cuán estrechamente relacionadas están dos variables (es decir, si son dependientes o independientes).

Correlación --- mide de qué manera se relacionan dos variables (es decir, positivas o negativas).


Al final, argumentaría que nunca puede equivocarse si los trata con claridad, ayudará a la interpretación y el análisis a largo plazo. Espero que esto ayude.

Dan Temkin
fuente
2
No rechacé esto, y gracias por el comentario positivo (acabo de aplicar una edición). Desafortunadamente, enturbia la discusión. Las medidas de asociación a menudo no tienen nada que ver con qué variable, si alguna, es dependiente. La correlación también mide "cuán estrechamente": cada definición de correlación se basa en una definición específica de la forma en que las variables están (idealmente) relacionadas (linealmente, monotónicamente, etc.) Los ejemplos familiares realmente no ayudan, incluso como analogías: Por ejemplo, madre, padre, tío no son variables cuantitativas en el ejemplo. Entonces, lo siento, pero la distinción que haces no es limpia en absoluto.
Nick Cox
Además, "sangre compartida" y "alejamiento" son muy diferentes.
Nick Cox