¿Es aceptable tener solo dos (o menos) elementos (variables) cargados por un factor en el análisis factorial?

Tengo un conjunto de 20 variables que he sometido a análisis factorial en SPSS. Para los fines de la investigación, necesito desarrollar 6 factores. SPSS ha demostrado que 8 variables (de 20) se han cargado con pesos bajos o se han cargado por igual por varios factores, por lo que las eliminé. Las 12 variables restantes se han cargado en pares de 2 en los 6 factores, que es la estructura perfecta, tal como quería, pero ahora, uno de los profesores que trabajan conmigo quiere que encuentre justificación por qué (o bajo qué condiciones) es apropiado mantener solo 2 ítems por factor, ya que se sabe comúnmente que el análisis factorial es útil con resultados cargados 3 o más ítems, por factor.

¿Alguien puede ayudarme con este problema, preferiblemente también con una referencia publicada?

spss factor-analysis references assumptions Mitja
fuente

Un factor de artículo único también es aceptable si ese artículo tiene una carga de factor mayor.

Meera Gang

"Al menos 3 elementos por factor" es una recomendación garantizada. Si, después de la rotación de factores, tiene resultados con 2 o un elemento en un factor, 1) obtenga más variables que espera que se carguen por ese factor, o 2) rehaga el análisis y extraiga menos factores, o 3) deje el resultados tal como están pero no interpretan el factor "necesitado", diciendo "Creo que ese factor existe, pero dado que actualmente no está suficientemente respaldado por elementos, lo elimino de la interpretación y de los resultados". Sin embargo, todas estas 2 recomendaciones son diferentes.

ttnphns

Consulte también, además de las respuestas aquí, stats.stackexchange.com/a/198684/3277 (punto 5) por qué "Al menos 3 elementos cargados por factor" es un requisito razonable.

ttnphns

Respuestas:

Dos o tres ítems por factor es una cuestión de identificación de su modelo CFA (FA confirmatorio).

Supongamos, por simplicidad, que el modelo se identifica estableciendo la varianza de cada factor en 1. Supongamos también que no hay errores de medición correlacionados.

Un modelo de factor único con dos elementos tiene dos cargas y dos variaciones de error para estimar = 4 parámetros, pero solo hay 3 entradas no triviales en la matriz de varianza-covarianza, por lo que no tiene suficiente información para estimar los cuatro parámetros Que tu necesitas.

Un modelo de factor único con tres elementos tiene tres cargas y tres variaciones de error. La matriz de varianza-covarianza tiene seis entradas, y un examen analítico cuidadoso muestra que el modelo está exactamente identificado, y puede expresar algebraicamente las estimaciones de los parámetros como funciones de las entradas de la matriz de varianza-covarianza. Con más elementos por factor individual, tiene un modelo sobreidentificado (más grados de libertad que parámetros), lo que generalmente significa que está listo para comenzar.

Con más de un factor, el modelo CFA siempre se identifica con más de 3 elementos por cada factor (porque se identifica un modelo de medición simple para cada factor, por lo que, en términos generales, puede obtener predicciones para cada factor y estimar sus covarianzas en función de eso). Sin embargo, se identifica un CFA con dos elementos por factor, siempre que cada factor tenga una covarianza distinta de cero con al menos otro factor en la población. (De lo contrario, el factor en cuestión se cae del sistema y no se identifica un modelo de factor único de dos elementos). La prueba de identificación es bastante técnica y requiere una buena comprensión del álgebra matricial.

Bollen (1989) analiza completa y exhaustivamente los problemas de identificación de los modelos CFA en el capítulo 7. Ver p. 244 específicamente en relación con las reglas de tres y dos indicadores.

StasK
fuente

Esta fue una respuesta muy adecuada. Solo comentaría (por el bien del OP) que el OP preguntó sobre FA exploratoria (EFA). Es lógico que EFA debería tener "3+ elementos cargados por factor" ya que CFA lo espera; solo que no lo dijiste en tu respuesta.

ttnphns

Nunca escuché sobre el criterio de "3 elementos por factor". Revertiría la pregunta y le pediría a su profesor que presente una referencia sólida para esta afirmación.

Además de eso, "a los fines de la investigación, necesito desarrollar 6 factores". Es una cosa rara que decir.

El propósito básico del análisis factorial es 1) averiguar cuántos factores (a menudo rasgos psicológicos) subyacen a un número (mayor) de variables medidas. Luego 2), en función de las cargas de factores, se intenta describir cuáles son realmente estos factores.

No "desarrolla" 6 factores, está "tratando de medir" 6 factores.

Sin embargo, las cargas cruzadas (variables cargadas por varios factores) presentes son a menudo una indicación de que los factores están "tratando de correlacionarse" entre sí. Lo cual tiene sentido ya que sabemos que básicamente todo se correlaciona con todo en el mundo real. La implementación de esta observación en su análisis mediante el uso de una rotación oblicua (en lugar del vértice ortogonal) a menudo elimina muchas cargas cruzadas. En mi humilde opinión, es más sólido en teoría también.

Dale una oportunidad, puedes terminar con más elementos por factor. Eso puede (en parte) resolver su problema también.

RubenGeert
fuente

Muchas gracias por su comentario, por qué seis factores que puedo explicar con un modelo que estoy usando, mi profesor no está en contra de la explicación de 6 factores, sin embargo, quiere una explicación cuando está bien usar un análisis factorial que solo tiene 2 elementos por factor . Esto sigue siendo la pregunta.

Mitja

Bienvenido al sitio, @ pythonforspss.org, aquí hay mucha buena información, +1. Un par de notas: he escuchado que varias veces he dicho que necesitas al menos 3 variables por factor, pero no sé cuál es la razón sustantiva (o si realmente hay alguna) para esta regla. Edité la Q del OP para hacer que el inglés sea más fluido; Puse la frase que cita para reemplazar lo que estaba allí de antemano. Puede que esto no haya sido ideal (no estaba seguro de cómo traducir lo que pensé que el OP podría estar tratando de decir), pero si es así es mi culpa, no de Mitja. Recuerde que el inglés no es el primer idioma de muchos usuarios.

gung - Restablece a Monica

Los tres ítems por factor son una creencia común y tienden a causar problemas en la etapa de revisión (ya que es una creencia común). Dicho esto, si sus comunidades son altas (> 0.7), entonces probablemente no tenga un problema.

richiemorrisroe

Mis comunalidades son 0.5 o más altas ...

Mitja

factors are "trying to correlate" with each otherEs una formulación mística. Los factores se correlacionan o no según la forma en que los rotamos (modelamos). Son posibles "cargas cruzadas" bastante altas con factores ortogonales con una variable que tiene alta comunalidad.

ttnphns

Tengo el mismo problema ahora. Aquí hay un artículo que recomienda usar al menos 3 elementos por factor. Sin embargo, en casos excepcionales, puede usar elementos por factor (p.60). http://www.sajip.co.za/index.php/sajip/article/download/168/165 Mi caso parece ser excepcional, ya que solo hay dos variables en mi experimento basado en la web, que proporcionan información sobre el jugador estrategia y poder de estrategia. Puede ser que también pueda ayudarlo a legitimar el uso de 2 elementos por algunos factores.

eugentango
fuente

Este sitio web tiene una serie de referencias que admiten el mínimo de tres variables por regla de factor: encorewiki.org/display/~nzhao/…