Para una variable aleatoria -dimensional , tenemos la siguiente definición de la varianza:pX=(X1,…,Xp)⊺
Var(X)=E[(X−EX)(X−EX)⊺]=⎛⎝⎜⎜Var(X1)⋮Cov(Xp,X1)…⋱…Cov(X1,Xp)⋮Var(Xp)⎞⎠⎟⎟
Es decir, la varianza de un vector aleatorio se define como la matriz que almacena todas las varianzas en la diagonal principal y las covarianzas entre los diferentes componentes en los otros elementos. La matriz de covarianza la muestra se calcularía luego conectando los análogos de muestra para las variables de población:p×p
1n−1⎛⎝⎜⎜⎜⎜⎜⎜⎜∑i=1n(Xi1−X¯⋅1)2⋮∑i=1n(Xip−X¯⋅p)(Xi1−X¯⋅1)…⋱…∑i=1n(Xi1−X¯⋅1)(Xip−X¯⋅p)⋮∑i=1n(Xip−X¯⋅p)2⎞⎠⎟⎟⎟⎟⎟⎟⎟
donde denota la ésima observación para la característica y la media muestral de
XijijX¯⋅jjth característica. En resumen, la varianza de un vector aleatorio se define como la matriz que contiene las varianzas y covarianzas individuales. Por lo tanto, es suficiente calcular las varianzas y covarianzas de muestra para todos los componentes del vector individualmente.
Philipp Burckhardt
fuente