¿En qué condiciones se puede esperar que el análisis de componentes principales (PCA) y el análisis factorial (FA) produzcan resultados similares?
pca
factor-analysis
estadísticas
fuente
fuente
p-m
últimos componentes principales: los que se caen en PCA (p
es el número de variables ym
es el número de componentes o factores que decidió extraer). Sip
es grande; 2) el ruido es pequeño para todas las variables; 3) el ruido es casi igual para todas las variables.Respuestas:
Esta es una excelente pregunta, pero desafortunadamente (¿o quizás afortunadamente?) Recientemente he escrito una respuesta muy larga en un hilo relacionado , abordando su pregunta casi exactamente. Le pediría amablemente que mire allí y vea si eso responde a su pregunta.
Muy brevemente, si solo nos centramos en las cargas de PCA y FAW , entonces la diferencia es que PCA encuentra W para reconstruir la matriz de covarianza de muestra (o correlación) C Tan cerca como sea posible:
Con esto en mente, la respuesta a su pregunta se vuelve fácil de ver. Si el numeron de variables (tamaño de C ) es grande, entonces la parte fuera de diagonal de C es casi toda la matriz (la diagonal tiene tamaño n y todo el tamaño de la matriz n2 , entonces la contribución de la diagonal es solo 1/n→0 ), por lo que podemos esperar que PCA se aproxime bien a FA. Si los valores diagonales son bastante pequeños, entonces nuevamente no juegan mucho papel para PCA, y PCA termina estando cerca de FA, exactamente como @ttnphns dijo anteriormente.
Si, por otro lado,C es pequeño o está fuertemente dominado por la diagonal (en particular si tiene valores muy diferentes en la diagonal), entonces PCA tendrá que sesgar W hacia la reproducción de la diagonal también, y así terminará siendo bastante diferente de FA. Un ejemplo se da en este hilo:
fuente