Como se indicó en esta pregunta, el rango máximo de la matriz de covarianza es donde es el tamaño de la muestra y, por lo tanto, si la dimensión de la matriz de covarianza es igual al tamaño de la muestra, sería singular. No puedo entender por qué restamos del rango máximo de la matriz de covarianza.
covariance-matrix
linear-algebra
usuario3070752
fuente
fuente
Respuestas:
El estimador imparcial de la matriz de covarianza muestral dadon puntos de datos xi∈Rd es donde ˉ x =∑xi/nes el promedio de todos los puntos. Denotemos(xi- ˉ x )comozi. El1
¿Por qué tengo rango n - 1 y no rango n , como parece porque estamos sumando n Rank- 1 matrices?∑ziz⊤i n−1 n n 1
La respuesta es que sucede porque no es independiente. Por construcción, ∑ z i = 0 . Entonces, si conoce n - 1 de z i , entonces el último z n restante está completamente determinado; no estamos sumando n independientes Rank- 1 matrices, estamos sumando solamente n - 1 independientes Rank- 1 matrices y luego la adición de uno más Rank- 1 matriz que está totalmente determinado linealmente por el resto. Esta última adición no cambia el rango general.zi ∑zi=0 n−1 zi zn n 1 n−1 1 1
Podemos ver esto directamente si reescribimos como z n = - n - 1 ∑ i = 1 z i , y ahora lo conectamos a la expresión anterior: n ∑ i = 1 z i z ⊤ i = n - 1 ∑ i = 1 z i z ⊤ i + ( - n - 1 ∑ i = 1∑zi=0
Este resultado, por cierto, sugiere por qué el factor en el estimador imparcial de covarianza es y no11n−1 .1n
La intuición geométrica a la que aludí en los comentarios anteriores es que siempre se puede ajustar una línea 1D a dos puntos en 2D y siempre se puede ajustar un plano 2D a tres puntos en 3D, es decir, la dimensionalidad del subespacio siempre es ; esto solo funciona porque suponemos que esta línea (y plano) se puede "mover" para ajustar nuestros puntos. "Posicionar" esta línea (o plano) de modo que pase a través de ˉ x es equivalente a centrarse en el argumento algebraico anterior.n−1 x¯
fuente
Un poco más corto, creo, la explicación es así:
Definamos matrizn x m matriz x de puntos de datos de muestra donde
n es un número de variables m es un número de muestras para cada variable. Supongamos que ninguna de las variables es linealmente dependiente.
El rango dex es min(n,m) .
Definamos la matrizn x m matriz z de variables centradas en rowwise:
fuente