La covarianza de dos variables se calculó en -150. ¿Qué dicen las estadísticas sobre la relación entre dos variables?
covariance
Sameera
fuente
fuente
Respuestas:
Para agregar a la respuesta de Łukasz Deryło : como él escribe, una covarianza de -150 implica una relación negativa. Si esta es una relación fuerte o débil depende de las variaciones de las variables. A continuación, trazo ejemplos para una relación fuerte (cada variable separada tiene una varianza de 200, por lo que la covarianza es grande, en términos absolutos, en comparación con la varianza), y para una relación débil (cada varianza es 2000, por lo que la covarianza es pequeña , en términos absolutos, en comparación con la varianza).
Relación fuerte,
variance <- 200
:Relación débil
variance <- 2000
:Código R:
EDITAR: cuarteto de Anscombe
Como señala Whuber, la covarianza en sí misma no nos dice mucho sobre un conjunto de datos. Para ilustrar, tomaré el cuarteto de Anscombe y lo modificaré ligeramente. Observe cómo los diagramas de dispersión muy diferentes pueden tener la misma covarianza (redondeada) de -150:
EDICIÓN FINAL (¡lo prometo!)
Por último, aquí hay una covarianza de -150 con quizás el más tenue "relación negativa" entre e imaginables:x y
fuente
Solo te dice que la relación es negativa. Esto significa que los valores bajos de una variable tienden a ocurrir junto con los valores altos de la otra.
Es difícil saber si esta covarianza es grande o pequeña (si su relación es fuerte o débil) porquecov(X,Y) rangos desde −sd(X)⋅sd(Y) a sd(X)⋅sd(Y) . Entonces depende de la escala de sus variables.
Para juzgar si esta relación es fuerte o no, debe convertir la covarianza en correlación (dividirla porsd(X)⋅sd(Y) ) Esto va desde−1 a 1 y se pueden encontrar muchas pautas diferentes para la interpretación en la Web y los libros de texto.
También puede ejecutar la prueba de importancia de la correlación.
fuente