¿Qué es la covarianza en lenguaje sencillo?

Respuestas:

82

La covarianza es una medida de cómo los cambios en una variable están asociados con los cambios en una segunda variable. Específicamente, la covarianza mide el grado en que dos variables están asociadas linealmente. Sin embargo, a menudo también se usa informalmente como una medida general de cuán monotónicamente relacionadas están dos variables. Hay muchas explicaciones intuitivas útiles de covarianza aquí .

Con respecto a cómo se relaciona la covarianza con cada uno de los términos que mencionó:

[1,1]±10

00

                ingrese la descripción de la imagen aquí

0

(3) La estructura de varianza / covarianza (a menudo llamada simplemente la estructura de covarianza ) en los diseños de medidas repetidas se refiere a la estructura utilizada para modelar el hecho de que las mediciones repetidas en individuos están potencialmente correlacionadas (y por lo tanto son dependientes) - esto se hace modelando el entradas en la matriz de covarianza de las mediciones repetidas. Un ejemplo es la estructura de correlación intercambiable con varianza constante que especifica que cada medición repetida tiene la misma varianza, y todos los pares de mediciones están igualmente correlacionados. Una mejor opción puede ser especificar una estructura de covarianza que requiera dos mediciones tomadas más separadas en el tiempo para estar menos correlacionadas (p. Ej.Un modelo autorregresivo ). Tenga en cuenta que el término estructura de covarianza surge más generalmente en muchos tipos de análisis multivariados en los que se permite correlacionar las observaciones.

Macro
fuente
2
Tu explicación es agradable. Le sigue un valioso suplemento que provocó una interesante serie de comentarios. Muchas gracias a todos :) !
Stan
23

La respuesta de Macro es excelente, pero quiero agregar más a un punto de cómo la covarianza está relacionada con la correlación. La covarianza realmente no le dice acerca de la fuerza de la relación entre las dos variables, mientras que la correlación sí. Por ejemplo:

x = [1, 2, 3]
y = [4, 6, 10]

cov(x,y) = 2 #I am using population covariance here

Ahora cambiemos la escala y multipliquemos x e y por 10

x = [10, 20, 30]
y = [40, 60, 100]

cov(x, y) = 200

Cambiar la escala no debería aumentar la fuerza de la relación, por lo que podemos ajustar dividiendo las covarianzas entre las desviaciones estándar de x e y, que es exactamente la definición del coeficiente de correlación.

En los dos casos anteriores, el coeficiente de correlación entre x e y es 0.98198.

Akavall
fuente
66
"La covarianza realmente no te dice acerca de la fuerza de la relación entre las dos variables, mientras que la correlación sí". Esa afirmación es completamente falsa. Las dos medidas son idénticas de escala de módulo por las dos desviaciones estándar.
David Heffernan
15
@DavidHeffernan, sí, si se escala por desviaciones estándar, entonces la covarianza nos informa sobre la fuerza de la relación. Sin embargo, la medida de covarianza por sí misma no nos dice eso.
Akavall
10
@DavidHeffernan, creo que lo que dice Akavall es que si no conoce la escala de las variables, entonces la covarianza no le dice nada sobre la fuerza de la relación, solo se puede interpretar el signo.
Macro
66
¿En qué situación práctica puede obtener una covarianza sin también poder obtener una buena estimación de la escala de las variables?
David Heffernan
77
Sin embargo, no siempre es necesario conocer la desviación estándar para comprender la escala de una variable y, por lo tanto, la fuerza de una relación. Los efectos no estandarizados son a menudo informativos. Por ejemplo, si hacer un curso de capacitación hace que las personas aumenten en promedio sus ingresos en $ 10,000 por año, eso es probablemente una mejor indicación de la fuerza del efecto, que decir que hubo una correlación de ar = .34 entre hacer el curso y los ingresos.
Jeromy Anglim