Sobre el uso de la rotación oblicua después de PCA

9

Varios paquetes estadísticos, como SAS, SPSS y R, le permiten realizar algún tipo de rotación de factores después de un PCA.

  1. ¿Por qué es necesaria una rotación después de un PCA?
  2. ¿Por qué aplicaría una rotación oblicua después de un PCA dado que el objetivo del PCA es producir dimensiones ortogonales?
pbneau
fuente
Hice una pregunta que ilustra la necesidad de la rotación de factores después de PCA ya que PCA da el resultado sesgado. Ver stats.stackexchange.com/questions/6575/…
mbaitoff

Respuestas:

8

Creo que hay diferentes opiniones o puntos de vista sobre PCA, pero básicamente a menudo lo consideramos como una técnica de reducción (reduce el espacio de sus características a uno más pequeño, a menudo mucho más "legible" siempre que se encargue de centrar / estandarizar adecuadamente datos cuando sea necesario) o una forma de construir factores latenteso dimensiones que representan una parte significativa de la dispersión interindividual (aquí, los "individuos" representan las unidades estadísticas en las que se recopilan los datos; esto puede ser país, personas, etc.). En ambos casos, construimos combinaciones lineales de las variables originales que representan el máximo de varianza (cuando se proyectan en el eje principal), sujeto a una restricción de ortogonalidad entre dos componentes principales. Ahora, lo que se ha descrito es puramente algebrical o matemático y no lo consideramos como un modelo (generador), al contrario de lo que se hace en la tradición del análisis factorial donde incluimos un término de error para explicar algún tipo de error de medición . También me gusta la introducción dada por William Revelle en su próximo manual sobre psicometría aplicada usando R (Capítulo 6), si queremos analizar la estructura de una matriz de correlación, entonces

El primer [enfoque, PCA] es un modelo que se aproxima a la matriz de correlación en términos del producto de los componentes donde cada componente es una suma lineal ponderada de las variables, el segundo modelo [análisis factorial] es también una aproximación de la matriz de correlación por El producto de dos factores, pero los factores en esto son vistos como causas más que como consecuencias de las variables.

En otras palabras, con PCA estás expresando cada componente (factor) como una combinación lineal de las variables, mientras que en FA estas son las variables que se expresan como una combinación lineal de los factores. Es bien sabido que ambos métodos generalmente arrojarán resultados bastante similares (ver, por ejemplo, Harman, 1976 o Catell, 1978), especialmente en el caso "ideal" en el que tenemos un gran número de individuos y un buen factor de relación: variables (típicamente variables entre 2 y 10 dependiendo de los autores que consideres). Esto se debe a que, al estimar las diagonales en la matriz de correlación (como se hace en FA, y estos elementos se conocen como las comunalidades), la varianza del error se elimina de la matriz de factores. Esta es la razón por la cual la PCA a menudo se usa como una forma de descubrir factores latentes o construcciones psicológicas en lugar de FA desarrolladas en el siglo pasado. Pero, a medida que avanzamos de esta manera, a menudo queremos alcanzar una interpretación más fácil de la estructura de factores resultante (o la llamada matriz de patrones). Y luego viene el truco útil de rotar el eje factorial para maximizar las cargas de las variables en un factor específico, o alcanzar de manera equivalente una "estructura simple". Usando la rotación ortogonal (por ejemplo, VARIMAX), preservamos la independencia de los factores. Con la rotación oblicua (p. Ej., OBLIMIN, PROMAX), la rompemos y los factores pueden correlacionarse. Esto ha sido ampliamente debatido en la literatura, y ha llevado a algunos autores (no psicometristas, sino estadísticos a principios de 1960)

Pero el punto es que los métodos de rotación se desarrollaron originalmente en el contexto del enfoque FA y ahora se usan de manera rutinaria con PCA. No creo que esto contradiga el cálculo algorítmico de los componentes principales: puede rotar sus ejes factoriales de la manera que desee, siempre que tenga en cuenta que una vez correlacionada (por rotación oblicua) la interpretación del espacio factorial se vuelve menos obvia.

La PCA se usa habitualmente al desarrollar nuevos cuestionarios, aunque la FA es probablemente un mejor enfoque en este caso porque estamos tratando de extraer factores significativos que tengan en cuenta los errores de medición y cuyas relaciones podrían estudiarse por sí mismas (por ejemplo, factorizando el patrón resultante matriz, obtenemos un modelo de factor de segundo orden). Pero PCA también se utiliza para verificar la estructura factorial de los ya validados. Los investigadores realmente no importan sobre FA vs. PCA cuando tienen, digamos 500 sujetos representativos a los que se les pide que califiquen un cuestionario de 60 ítems que aborda cinco dimensiones (este es el caso del NEO-FFI, por ejemplo), y creo que tienen razón porque en este caso no estamos muy interesados ​​en identificar un modelo generador o conceptual (el término "representante" se usa aquí para aliviar el problema de la invariancia de la medición ).

Ahora, sobre la elección del método de rotación y por qué algunos autores argumentan en contra del uso estricto de la rotación ortogonal, me gustaría citar a Paul Kline, como lo hice en respuesta a la siguiente pregunta, FA: Elección de la matriz de rotación, basada en "Estructura simple Criterios " ,

(...) en el mundo real, no es irracional pensar que los factores, como determinantes importantes del comportamiento, estarían correlacionados. - P. Kline, Inteligencia. La vista psicométrica , 1991, p. 19

Por lo tanto, concluiría que, dependiendo del objetivo de su estudio (¿desea resaltar los patrones principales de su matriz de correlación o busca proporcionar una interpretación sensata de los mecanismos subyacentes que pueden haberle causado observar dicha matriz de correlación? ), puede elegir el método más apropiado: esto no tiene que ver con la construcción de combinaciones lineales, sino simplemente en la forma en que desea interpretar el espacio factorial resultante.

Referencias

  1. Harman, HH (1976). Análisis factorial moderno . Chicago, Universidad de Chicago Press.
  2. Cattell, RB (1978). El uso científico del análisis factorial . Nueva York, Plenum.
  3. Kline, P. (1991). Inteligencia. La vista psicométrica . Routledge.
chl
fuente
4

El problema con las dimensiones ortogonales es que los componentes pueden ser ininterpretables. Por lo tanto, mientras que la rotación oblicua (es decir, las dimensiones no ortogonales) es técnicamente menos satisfactoria, dicha rotación a veces mejora la interpretación de los componentes resultantes.


fuente
4

Puntos básicos

  • La rotación puede hacer que la interpretación de los componentes sea más clara
  • La rotación oblicua a menudo tiene más sentido teórico. Es decir, las variables observadas pueden explicarse en términos de un número menor de componentes correlacionados.

Ejemplo

  • 10 prueba todas las habilidades de medición con algunas habilidades verbales y otras espaciales. Todas las pruebas están intercorrelacionadas, pero las intercorrelaciones dentro de las pruebas verbales o espaciales son mayores que a través del tipo de prueba. Un PCA parsimonioso podría involucrar dos componentes correlacionados, uno verbal y otro espacial. La teoría y la investigación sugieren que estas dos habilidades están correlacionadas. Por lo tanto, una rotación oblicua tiene sentido teórico.
Jeromy Anglim
fuente