¿Qué son los componentes principales "rotados" y "no rotados", dado que PCA siempre rota los ejes de coordenadas?

13

Hasta donde entiendo, los componentes principales se obtienen al rotar los ejes de coordenadas para alinearlos con las direcciones de máxima varianza.

Sin embargo, sigo leyendo sobre "componentes principales no rotados" y mi software de estadísticas (SAS) me da componentes principales rotados varimax, así como los componentes no rotados. Aquí estoy confundido: cuando calculamos los componentes principales, los ejes ya están rotados; Entonces, ¿por qué se necesita otra rotación? ¿Y qué significa "componente principal no rotado"?

Srewashi Lahiri
fuente
1
Las preguntas únicamente sobre cómo funciona el software están fuera de tema aquí, pero es posible que tenga una pregunta estadística real enterrada aquí. Es posible que desee editar su pregunta para aclarar el problema estadístico subyacente. Es posible que cuando comprenda los conceptos estadísticos involucrados, los elementos específicos del software sean evidentes o al menos fáciles de obtener de la documentación.
gung - Restablece a Monica
1
@gung - Mi pregunta no es sobre software. Puede ser que lo coloque mal. Todo lo que quería saber es que, según tengo entendido, obtenemos componentes principales solo cuando giramos los ejes en la línea de máxima varianza. Entonces, qué es el componente principal no rotado, un término que encontré en varias páginas que explican sobre PCA. Por favor, hágame saber si mi pregunta sigue siendo ambigua.
Srewashi Lahiri
Ciertamente parece que se trata de SAS. Si no es así, editaría su Q para eliminar las referencias a SAS y volvería a explicar su pregunta en términos de software neutral. También te puede interesar leer este hilo .
gung - Restablece a Monica
Mencioné SAS porque estaba realizando el análisis en ese software. Incluso si descarta la palabra, puede proporcionarme una explicación de mi versión editada de la pregunta. También pasé por el hilo. Amablemente corrígeme si estoy equivocado. Cuando calculamos componentes principales, significa que los ejes ya están rotados. Por lo tanto, no se requiere otra notación varimax. ¿Es eso así? Estoy realmente confundido acerca de esta parte. Muchas gracias de antemano
Srewashi Lahiri
2
Srewashi, me he tomado la libertad de reescribir sustancialmente tu pregunta según tus aclaraciones en los comentarios. Creo que es una buena pregunta, +1. ¡Comprueba que mis ediciones reflejan tus intenciones! Siempre puedes editar más. CC a @gung.
ameba dice Reinstate Monica

Respuestas:

15

Esta será una respuesta no técnica.

Tiene razón: PCA es esencialmente una rotación de los ejes de coordenadas, elegidos de tal manera que cada eje exitoso capture la mayor variación posible.

En algunas disciplinas (como, por ejemplo, psicología), a las personas les gusta aplicar PCA para interpretar los ejes resultantes. Es decir, quieren poder decir que el eje principal n. ° 1 (que es una cierta combinación lineal de variables originales) tiene algún significado particular. Para adivinar este significado, mirarían los pesos en la combinación lineal. Sin embargo, estos pesos son a menudo desordenados y no se puede discernir un significado claro.

En estos casos, las personas a veces optan por jugar un poco con la solución PCA de vainilla. Toman cierto número de ejes principales (que se consideran "significativos" por algún criterio) y además los rotan, tratando de lograr alguna "estructura simple", es decir, combinaciones lineales que serían más fáciles de interpretar. Hay algoritmos específicos que buscan la estructura más simple posible; uno de ellos se llama varimax. Después de la rotación varimax, los componentes sucesivos ya no capturan tanta varianza como sea posible. Esta característica de PCA se rompe al hacer la rotación varimax adicional (o cualquier otra).

Entonces, antes de aplicar la rotación varimax, tiene componentes principales "no rotados". Y luego, obtienes componentes principales "rotados". En otras palabras, esta terminología se refiere al procesamiento posterior de los resultados de PCA y no a la rotación de PCA en sí.


Todo esto es algo complicado por el hecho de que lo que se rota son cargas y no ejes principales como tales. Sin embargo, para los detalles matemáticos, lo remito (y cualquier lector interesado) a mi larga respuesta aquí: ¿PCA seguido de una rotación (como varimax) sigue siendo PCA?

ameba dice reinstalar Monica
fuente
Todavía no he encontrado una explicación mejor y más clara. También pasé por el otro enlace que me ha proporcionado, pero todavía tengo que descifrarlo en su totalidad. Si entendí bien, los componentes principales no rotados ya son ortogonales y no están correlacionados. Aquí tengo un poco de confusión: como las PC corresponden a la varianza máxima sucesiva, entonces es necesario que después de encontrar la primera PC, la segunda línea de varianza máxima (segunda PC) esté a 90 grados (ortogonal) a la primera y así sucesivamente ?
Srewashi Lahiri
Así es: los componentes principales "no rotados" no están correlacionados y los ejes principales "no rotados" son ortogonales. Y sí, es necesario que los ejes principales sucesivos sean componentes ortogonales y principales que no estén correlacionados con los anteriores (se puede demostrar matemáticamente). Por cierto, si cree que esta respuesta (o cualquier otra) resuelve el problema por usted, puede "aceptarla" haciendo clic en la marca verde a la izquierda. Una vez que alcances 15 reputación, también podrás votar las respuestas que encuentres útiles (creo que actualmente no puedes votar las respuestas).
ameba dice Reinstate Monica
+1. what gets rotated are loadings and not principal axes as suchYo agregaría que esta es una noción técnica. Teóricamente, estos dos tipos de rotación son yuxtaposicionales. En PCA, rotamos para encontrar la base ortogonal específica (la que tiene el diagrama de pantalla más empinado de los valores propios). En varimax, rotamos para encontrar otra base ortogonal específica (con la estructura más interpetable). Podríamos hacer cualquier tipo de base ortogonal.
ttnphns
Si es posible, ¿puede explicarlo en términos simples lo que significan las PC sin rotar?
sai_636
@ sai_636 Para conocer los términos simples, consulte stats.stackexchange.com/questions/2691 .
ameba dice Reinstate Monica