Hasta donde entiendo, los componentes principales se obtienen al rotar los ejes de coordenadas para alinearlos con las direcciones de máxima varianza.
Sin embargo, sigo leyendo sobre "componentes principales no rotados" y mi software de estadísticas (SAS) me da componentes principales rotados varimax, así como los componentes no rotados. Aquí estoy confundido: cuando calculamos los componentes principales, los ejes ya están rotados; Entonces, ¿por qué se necesita otra rotación? ¿Y qué significa "componente principal no rotado"?
pca
terminology
factor-rotation
Srewashi Lahiri
fuente
fuente
Respuestas:
Esta será una respuesta no técnica.
Tiene razón: PCA es esencialmente una rotación de los ejes de coordenadas, elegidos de tal manera que cada eje exitoso capture la mayor variación posible.
En algunas disciplinas (como, por ejemplo, psicología), a las personas les gusta aplicar PCA para interpretar los ejes resultantes. Es decir, quieren poder decir que el eje principal n. ° 1 (que es una cierta combinación lineal de variables originales) tiene algún significado particular. Para adivinar este significado, mirarían los pesos en la combinación lineal. Sin embargo, estos pesos son a menudo desordenados y no se puede discernir un significado claro.
En estos casos, las personas a veces optan por jugar un poco con la solución PCA de vainilla. Toman cierto número de ejes principales (que se consideran "significativos" por algún criterio) y además los rotan, tratando de lograr alguna "estructura simple", es decir, combinaciones lineales que serían más fáciles de interpretar. Hay algoritmos específicos que buscan la estructura más simple posible; uno de ellos se llama varimax. Después de la rotación varimax, los componentes sucesivos ya no capturan tanta varianza como sea posible. Esta característica de PCA se rompe al hacer la rotación varimax adicional (o cualquier otra).
Entonces, antes de aplicar la rotación varimax, tiene componentes principales "no rotados". Y luego, obtienes componentes principales "rotados". En otras palabras, esta terminología se refiere al procesamiento posterior de los resultados de PCA y no a la rotación de PCA en sí.
Todo esto es algo complicado por el hecho de que lo que se rota son cargas y no ejes principales como tales. Sin embargo, para los detalles matemáticos, lo remito (y cualquier lector interesado) a mi larga respuesta aquí: ¿PCA seguido de una rotación (como varimax) sigue siendo PCA?
fuente
what gets rotated are loadings and not principal axes as such
Yo agregaría que esta es una noción técnica. Teóricamente, estos dos tipos de rotación son yuxtaposicionales. En PCA, rotamos para encontrar la base ortogonal específica (la que tiene el diagrama de pantalla más empinado de los valores propios). En varimax, rotamos para encontrar otra base ortogonal específica (con la estructura más interpetable). Podríamos hacer cualquier tipo de base ortogonal.