¿Por qué el rango de matriz de covarianza es como máximo

17

Como se indicó en esta pregunta, el rango máximo de la matriz de covarianza es n1 donde n es el tamaño de la muestra y, por lo tanto, si la dimensión de la matriz de covarianza es igual al tamaño de la muestra, sería singular. No puedo entender por qué restamos 1 del rango máximo n de la matriz de covarianza.

usuario3070752
fuente
1
Para obtener la intuición, piense en n=2 puntos en 3D. ¿Cuál es la dimensionalidad del subespacio en el que se encuentran estos puntos? ¿Puedes colocarlos en una línea (subespacio 1D)? ¿O necesitas un plano (subespacio 2D)?
ameba dice Reinstate Monica
¿Entonces entiendes que n=2 conduce a la matriz de covarianza de rango 1? Bien, tomemos n=3 puntos. ¿Puedes ver que siempre puedes ajustarlos en un plano 2D?
ameba dice Reinstate Monica
44
@amoeba, su ejemplo fue claro, pero no puedo entender cuál es la relación entre ajustar el hiperplano en su ejemplo y la matriz de covarianza.
user3070752
Perdón por el retraso;)
user3070752

Respuestas:

20

El estimador imparcial de la matriz de covarianza muestral dado n puntos de datos xiRd es donde ˉ x =xi/nes el promedio de todos los puntos. Denotemos(xi- ˉ x )comozi. El1

C=1n1i=1n(xix¯)(xix¯),
x¯=xi/n(xix¯)zi factor n - 1 no cambia el rango, y cada término en la suma tiene (por definición) el rango1, por lo que el núcleo de la pregunta es el siguiente:1n11

¿Por qué tengo rango n - 1 y no rango n , como parece porque estamos sumando n Rank- 1 matrices?zizin1nn1

La respuesta es que sucede porque no es independiente. Por construcción, z i = 0 . Entonces, si conoce n - 1 de z i , entonces el último z n restante está completamente determinado; no estamos sumando n independientes Rank- 1 matrices, estamos sumando solamente n - 1 independientes Rank- 1 matrices y luego la adición de uno más Rank- 1 matriz que está totalmente determinado linealmente por el resto. Esta última adición no cambia el rango general.zizi=0n1ziznn1n111

Podemos ver esto directamente si reescribimos como z n = - n - 1 i = 1 z i , y ahora lo conectamos a la expresión anterior: n i = 1 z i z i = n - 1 i = 1 z i z i + ( - n - 1 i = 1zi=0

zn=i=1n1zi,
Ahora solo quedan n - 1 términos en la suma y queda claro que toda la suma puede tener como máximo el rango n - 1 .
i=1nzizi=i=1n1zizi+(i=1n1zi)zn=i=1n1zi(zizn).
n1n1

Este resultado, por cierto, sugiere por qué el factor en el estimador imparcial de covarianza es y no11n1 .1n

La intuición geométrica a la que aludí en los comentarios anteriores es que siempre se puede ajustar una línea 1D a dos puntos en 2D y siempre se puede ajustar un plano 2D a tres puntos en 3D, es decir, la dimensionalidad del subespacio siempre es ; esto solo funciona porque suponemos que esta línea (y plano) se puede "mover" para ajustar nuestros puntos. "Posicionar" esta línea (o plano) de modo que pase a través de ˉ x es equivalente a centrarse en el argumento algebraico anterior.n1x¯

ameba dice Reinstate Monica
fuente
0

Un poco más corto, creo, la explicación es así:

Definamos matriz n x m matriz x de puntos de datos de muestra donde n es un número de variables m es un número de muestras para cada variable. Supongamos que ninguna de las variables es linealmente dependiente.

El rango de x es min(n,m) .

Definamos la matriz n x m matriz z de variables centradas en rowwise:

z=xE[x]

min(n,m1)

i=1mzi=0

z

x

cov(x,x)=1m1zzT

rank(zzT)

rank(zzT)=rank(z)=min(n,m1)

Mikel
fuente