Antecedentes: le pregunté a cientos de participantes en mi encuesta cuánto están interesados en áreas seleccionadas (en escalas Likert de cinco puntos con 1 que indica "no interesado" y 5 que indica "interesado").
Entonces probé PCA. La siguiente imagen es una proyección de los dos primeros componentes principales. Los colores se utilizan para los géneros y las flechas de PCA son variables originales (es decir, intereses).
Me di cuenta que:
- Los puntos (encuestados) están bastante bien separados por el segundo componente.
- No quedan puntas de flecha.
- Algunas flechas son mucho más cortas que otras.
- Las variables tienden a formar grupos, pero no las observaciones.
- Parece que las flechas que apuntan hacia abajo (a los hombres) son principalmente los intereses de los hombres y las flechas que apuntan hacia arriba son principalmente los intereses de las mujeres.
- Algunas flechas no apuntan hacia abajo ni hacia arriba.
Preguntas: ¿Cómo interpretar correctamente las relaciones entre puntos (encuestados), colores (géneros) y flechas (variables)? ¿Qué otras conclusiones sobre los encuestados y sus intereses se pueden extraer de esta trama?
Los datos se pueden encontrar aquí .
Respuestas:
Los puntos son los encuestados y los colores son los géneros. Esto ya lo sabes. Los ejes principales de su diagrama representan el primer y segundo puntaje de PC y los individuos se trazan sobre esa base. Alguien en el cuadrante inferior izquierdo obtuvo puntajes bajos en ambos. PC2 parece indicar intereses "masculinos" y "femeninos". No sé qué significa PC1, pero probablemente representa un puntaje de interés general: las personas con muchos intereses obtienen un puntaje alto. O tal vez representa a personas con intereses apasionados (puntaje 5).
Los vectores son un sistema de coordenadas proyectadas para las variables originales. Entonces, si proyecta un punto perpendicularmente en, por ejemplo, el vector de lectura, debe obtener el puntaje de lectura de esa persona. La posición relativa es importante aquí.
Tome un vector "masculino" como "deportes de adrenalina". Ahora imagine que proyecta una mancha rosa sobre ella desde lo alto en el cuadrante superior derecho. La coordinación de esa persona en "deportes de adrenalina" será negativa.
Entonces, ¿por qué todas las flechas están en la mitad derecha del gráfico? Dada la geometría, cuanto más profunda esté una persona en el lado izquierdo de la gráfica, menos proyecciones serán positivas. Esto sugiere que PC1 es una medida del nivel de interés general.
No estoy seguro de qué más puedes aprender aquí. Es posible que desee ver PC3 y PC4, si PC1 y PC2 solo le dicen que algunas personas tienen más intereses que otras y que los hombres son diferentes de las mujeres.
Su trama parece casi simétrica alrededor del eje PC1 y simétrica con respecto al género. Tanto hombres tienen intereses femeninos como mujeres tienen intereses masculinos ... ¿o es eso cierto? Solo estoy mirando los puntos. Puede ser interesante observar áreas donde el mapa no es simétrico: PC1 grande, PC2 moderadamente negativa --- ese sector tiene mucha acción. ¿Por qué?
fuente