Actualmente estoy pasando por un conjunto de diapositivas que tengo para el "análisis factorial" (PCA por lo que puedo decir).
En él, se deriva el "teorema fundamental del análisis factorial" que afirma que la matriz de correlación de los datos que entran en el análisis ( ) se puede recuperar utilizando la matriz de cargas factoriales ( A ):
Esto sin embargo me confunde. En PCA, la matriz de "cargas factoriales" viene dada por la matriz de vectores propios de la matriz de covarianza / correlación de los datos (dado que asumimos que los datos han sido estandarizados, son los mismos), con cada vector propio escalado para tener longitud uno. Esta matriz es ortogonal, por lo tanto que es en general no es igual a R .
pca
factor-analysis
terminology
definition
usuario2249626
fuente
fuente
A
(que son cargas), por razones de claridad. La matriz del vector propio (lado derecho) generalmente está etiquetadaV
(porqueR=USV'
por svd), noA
. Otro nombre equivalente (que proviene de la terminología biplot) para vectores propios es "coordenadas estándar", y para cargas es "coordenadas principales".Respuestas:
Esta es una pregunta razonable (+1) que se deriva de la ambigüedad terminológica y la confusión.
En el contexto de PCA, las personas a menudo llaman "cargas" a los ejes principales (vectores propios de la matriz de covarianza / correlación). Esta es una terminología descuidada. Lo que debería llamarse "cargas" en PCA, son ejes principales escalados por las raíces cuadradas de los respectivos valores propios. Entonces el teorema al que te refieres se mantendrá.
Consulte mi respuesta aquí para obtener más información sobre la reconstrucción de matrices de covarianza con análisis factorial y cargas de PCA.
fuente