Derivando la matriz de dispersión total (dentro de la clase + entre clases)

14

Estaba jugando con los métodos PCA y LDA y estoy atascado en un punto, tengo la sensación de que es tan simple que no puedo verlo.

Las matrices de dispersión dentro de clase ( SW ) y entre clases ( SB ) se definen como:

SW=i=1Ct=1N(xtiμi)(xtiμi)T

SB=i=1CN(μiμ)(μiμ)T

La matriz de dispersión total se da como:ST

ST=i=1Ct=1N(xtiμ)(xtiμ)T=SW+SB

donde C es el número de clases y N es el número de muestras son muestras, μ i es la media de la clase, μ es la media general.xμiμ

Mientras intentaba obtener , llegué a un punto en el que tenía:ST

(xμi)(μiμ)T+(μiμ)(xμi)T

como un término Esto debe ser cero, pero ¿por qué?


En efecto:

ST=i=1Ct=1N(xtiμ)(xtiμ)T=i=1Ct=1N(xtiμi+μiμ)(xtiμi+μiμ)T=SW+SB+i=1Ct=1N[(xtiμi)(μiμ)T+(μiμ)(xtiμi)T]
nimcap
fuente
2
La respuesta es que estás sumando las desviaciones de los valores alrededor de su media y esa suma es cero. Pero, ¿qué son, precisamente, , m y m i ? ¿Cómo son m y estoy i relacionado con mu y mu i ? La calidad de las respuestas dependerá de la precisión con la que adivinemos, ¡pero nos está obligando a hacer muchas conjeturas! xmmimmiμμi
whuber
@whuber: You are totally right, I revised my question.
nimcap

Respuestas:

8

If you assume

1Nt=1Nxti=μi

Then

i=1Ct=1N(xtiμi)(μiμ)T=i=1C(t=1N(xtiμi))(μiμ)T=0

and formula holds. You deal with the second term in the similar way.

mpiktas
fuente
2
(+1) The second term, being the transpose of the first, must also be zero :-).
whuber
@whuber, yes, that too :)
mpiktas
Hi,i don't get why the assumption holds?Can someone explain that?
Mvkt
1
@Mvkt It is not so much an assumption as the definition of μi I suppose. That is to say: μi is the mean of the observations in group i. I expect the answer uses 'assume' because the OP doesn't explain the notation, so we have to guess that the group mean is meant by μi.
Vincent