Estoy tratando de entender cómo funciona la matriz de covarianza . Supongamos que tenemos dos variables:, dónde da la relación entre las variables, es decir, cuánto depende una de la otra.
Ahora, tres casos variables es menos claro para mí. Una definición intuitiva para la función de covarianza sería, pero en cambio la literatura sugiere usar una matriz de covarianza que se define como dos covarianzas variables para cada par de variables.
Entonces, ¿la covarianza incluye información completa sobre relaciones variables? Si es así, ¿cuál es la relación con mi definición de?
correlation
covariance
moments
Karolis
fuente
fuente
Respuestas:
Para ampliar el comentario de Zachary, la matriz de covarianza no captura la "relación" entre dos variables aleatorias, ya que "relación" es un concepto demasiado amplio. Por ejemplo, probablemente querríamos incluir la dependencia de dos variables entre sí para incluirlas en cualquier medida de su "relación". Sin embargo, sabemos quecov(X,Y)=0 no implica que sean independientes, como es el caso de dos variables aleatorias X ~ U (-1,1) e Y = X ^ 2 (para una breve prueba, consulte: https://en.wikipedia.org / wiki / Covarianza # falta de correlación e independencia ).
Entonces, si pensáramos que la covarianza incluye información completa sobre las relaciones variables, como usted pregunta, la covarianza cero sugiere que no hay dependencia. Esto es lo que quiere decir Zachary cuando dice que puede haber dependencias no lineales que la covarianza no captura.
Sin embargo, dejemosX:=(X1,...,Xn)′ ser multivariante normal, X ~N(μ,Σ) . EntoncesX1,...,Xn son independientes si Σ es una matriz diagonal con todos los elementos fuera de la diagonal = 0 (si todas las covarianzas = 0).
Para ver que esta condición es suficiente, observe que los factores de densidad articular,f(x1,...,xn)=1(2π)n|Σ|−−−−−−−√exp(−12(x−μ)′Σ−1(x−μ))=Πni=112πσii−−−−√exp(−(xi−μi)22σii)=f1(x1)...fn(xn) .
Para ver que la condición es necesaria, recuerde el caso bivariado. SiX1 y X2 son independientes, entonces X1 y X1|X2=x2 debe tener la misma varianza, entonces
lo que implicaσ12=0 . Por el mismo argumento, todos los elementos fuera de la diagonal deΣ debe ser cero
(fuente: diapositivas de Econometría avanzada del profesor Geert Dhaene)
fuente