¿Puedo entender el análisis factorial de la siguiente manera?
Supongamos que tengo 5 variables independientes (A, B, C, D, E)
El análisis factorial me permite hacer que (D, E) sean variables dependientes y me permiten hacer que sean combinaciones lineales de (A, B, C).
Por lo tanto, solo necesitaré transportar datos (A, B, C) y la matriz , luego puedo recrear datos (D, E) por datos (A, B, C) y la matriz .
Solo hace la reducción de datos. Estoy en lo cierto?
factor-analysis
Marco
fuente
fuente
Respuestas:
No. En el análisis factorial, todas las variables son variables dependientes y dependen de factores latentes (y también contienen errores de medición). Si bien los puntajes de los factores a menudo se usan en lugar de las variables originales, lo que puede parecer un problema de reducción de datos, esto es precisamente a lo que apunta el análisis de factores. En otras palabras, en lugar de decir: "Guau, tengo muchos datos que realmente no puedo procesar y entender; ¿puedo encontrar un truco para tener menos variables?", El análisis factorial generalmente se realiza en la situación " No puedo medir una cosa directamente, así que intentaré diferentes enfoques; sé que tendré muchos datos, pero estos serían datos relacionados de estructura conocida, y podré explotar esa estructura para aprender sobre esa cosa. que no pude medir directamente ".
Lo que describió califica como regresión multivariada (no confunda con regresión múltiple, que abarca una variable dependiente y muchas variables explicativas; la regresión multivariada tiene muchas variables dependientes y el mismo conjunto de variables explicativas en cada regresión individual), o correlaciones canónicas ( aunque con un poco de imaginación), o un modelo de ecuaciones estructurales de múltiples indicadores y causas múltiples, puede ser. Pero no, este no es un análisis factorial.
fuente
para agregar a la excelente respuesta de @ StasK, aclararé más al decir que este problema cae dentro del paraguas general del modelado de ecuaciones estructurales (SEM). SEM es una técnica que puede emplearse para modelar estructuras de covarianza y, aunque generalmente se usa con variables no observadas o latentes, también se puede aplicar a modelos con solo variables observadas o manifiestas. aplicando la metodología y la terminología SEM a su problema, D y E se considerarían variables endógenas, mientras que A, B y C son variables exógenas. la endogenia sugiere que la varianza en la variable particular se explica por otra variable, mientras que la exogenia sugiere que la varianza no se explica por otra variable, latente o manifiesta.
werner wothke proporciona algunas buenas diapositivas que presentan SEM usando SAS aquí .
También busque el sitio de ed rigdon que discuta una variedad de temas SEM (¡demasiado nuevo, no se puede vincular!).
volviendo a lo básico, si su objetivo es comprender el análisis factorial, sugeriría comenzar con un texto aplicado como el análisis factorial confirmatorio de brown para la investigación aplicada .
fuente