En PCA, cuando el número de dimensiones es mayor (o incluso igual) al número de muestras , ¿por qué tendrá como máximo vectores propios distintos de cero? En otras palabras, el rango de la matriz de covarianza entre las dimensiones es .N N - 1 d ≥ N N - 1
Ejemplo: sus muestras son imágenes vectorizadas, que son de dimensión , pero solo tiene imágenes.N = 10
pca
dimensionality-reduction
eigenvalues
GrokingPCA
fuente
fuente
Respuestas:
Considere lo que hace PCA. En pocas palabras, PCA (como se ejecuta normalmente) crea un nuevo sistema de coordenadas al:
(Para obtener más detalles, consulte este excelente hilo CV: dar sentido al análisis de componentes principales, vectores propios y valores propios ). Sin embargo, no solo gira sus ejes de la manera anterior. Su nuevo (el primer componente principal) está orientado en la dirección de variación máxima de sus datos. El segundo componente principal está orientado en la dirección de la siguiente mayor cantidad de variación que es ortogonal al primer componente principal . Los componentes principales restantes se forman de la misma manera.X1
fuente