¿Alguien puede ayudarme a interpretar los puntajes de PCA? Mis datos provienen de un cuestionario sobre actitudes hacia los osos. Según las cargas, he interpretado uno de mis componentes principales como "miedo a los osos". ¿Se relacionarían los puntajes de ese componente principal con la forma en que cada encuestado mide hasta ese componente principal (si él / ella obtiene puntajes positivos / negativos en él)?
16
Respuestas:
Básicamente, los puntajes de los factores se calculan como las respuestas sin procesar ponderadas por las cargas de los factores. Por lo tanto, debe observar las cargas de factores de su primera dimensión para ver cómo cada variable se relaciona con el componente principal. Observar altas cargas positivas (resp. Negativas) asociadas a variables específicas significa que estas variables contribuyen positivamente (resp. Negativamente) a este componente; por lo tanto, las personas con puntajes altos en estas variables tenderán a tener puntajes de factores más altos (o más bajos) en esta dimensión particular.
Dibujar el círculo de correlación es útil para tener una idea general de las variables que contribuyen "positivamente" frente a "negativamente" (si corresponde) al primer eje principal, pero si está utilizando R, puede echar un vistazo al paquete FactoMineR y La
dimdesc()
función.Aquí hay un ejemplo con los
USArrests
datos:Como se puede ver en el último resultado, la primera dimensión refleja principalmente actos violentos (de cualquier tipo). Si miramos el mapa individual, está claro que los estados ubicados a la derecha son aquellos en los que tales actos son más frecuentes.
También le puede interesar esta pregunta relacionada: ¿Qué son los puntajes de los componentes principales?
fuente
Para mí, los puntajes de PCA son solo arreglos de los datos en una forma que me permite explicar el conjunto de datos con menos variables. Los puntajes representan cuánto se relaciona cada elemento con el componente. Puede nombrarlos según el análisis factorial, pero es importante recordar que no son variables latentes, ya que PCA analiza todas las variaciones en el conjunto de datos, no solo los elementos en común (como lo hace el análisis factorial).
fuente
Los resultados de la PCA (las diferentes dimensiones o componentes) generalmente no se pueden traducir a un concepto real. Creo que es incorrecto suponer que uno de los componentes es el "miedo a los osos". El procedimiento de componentes principales transforma su matriz de datos en una nueva matriz de datos con la misma o menor cantidad de dimensiones, y las dimensiones resultantes van desde la que explica mejor la varianza a la que explica menos. Estos componentes se calculan en función de una combinación de las variables originales con los vectores propios calculados. El procedimiento de PCA general convierte las variables originales en ortogonales (linealmente independientes). Espero que esto te ayude a aclarar un poco sobre el procedimiento de PCA
fuente