Solía analizar elementos desde un punto de vista psicométrico. Pero ahora estoy tratando de analizar otro tipo de preguntas sobre motivación y otros temas. Estas preguntas están todas en escalas Likert. Mi pensamiento inicial fue utilizar el análisis factorial, porque las preguntas tienen la hipótesis de reflejar algunas dimensiones subyacentes.
- Pero, ¿es apropiado el análisis factorial?
- ¿Es necesario validar cada pregunta con respecto a su dimensionalidad?
- ¿Hay algún problema con la realización de análisis factorial en elementos likert?
- ¿Existen buenos documentos y métodos sobre cómo realizar análisis factoriales en Likert y otros elementos categóricos?
Respuestas:
Por lo que he visto hasta ahora, FA se usa para elementos de actitud como lo es para otro tipo de escalas de calificación. El problema que surge de la métrica utilizada (es decir, "¿las escalas de Likert realmente deben tratarse como escalas numéricas?" Es un debate de larga data, pero siempre que verifique la distribución de respuesta en forma de campana, puede manejarlas como mediciones continuas, de lo contrario, verifique si hay modelos FA no lineales o una escala óptima ) pueden manejarse con modelos IRT politómicos, como la respuesta gradual, la escala de calificación o el modelo de crédito parcial. Los dos últimos pueden usarse como una verificación aproximada de si las distancias de umbral, como se usan en los ítems tipo Likert, son una característica del formato de respuesta (RSM) o del ítem particular (PCM).
Con respecto a su segundo punto, se sabe, por ejemplo, que las distribuciones de respuestas en las encuestas de actitud o salud difieren de un país a otro (por ejemplo, los chinos tienden a resaltar patrones de respuesta "extremos" en comparación con los que provienen de países occidentales, ver por ejemplo Song , X.-Y. (2007) Análisis de modelos de ecuaciones estructurales de múltiples muestras con aplicaciones a datos de calidad de vida, en Handbook of Latent Variable and Related Models , Lee, S.-Y. (Ed.), Pp 279-302, Norte -Holanda). Algunos métodos para manejar tal situación fuera de mi cabeza:
Ahora, el punto es que la mayoría de estos enfoques se centran en el nivel del elemento (efecto techo / piso, disminución de la confiabilidad, estadísticas de ajuste del elemento incorrecto, etc.), pero cuando uno está interesado en cómo las personas se desvían de lo que se esperaría de un ideal conjunto de observadores / encuestados, creo que debemos centrarnos en los índices de ajuste de la persona en su lugar.
Como propusieron Eid y Zickar (2007), combinando un modelo de clase latente (para aislar al grupo de encuestados, por ejemplo, aquellos que siempre responden en las categorías extremas frente a los demás) y un modelo IRT (para estimar parámetros de ítems y ubicaciones de personas en el estado latente rasgo en ambos grupos) parece una buena solución. En su artículo se describen otras estrategias de modelado (por ejemplo, modelo HÍBRIDO, véase también Holden y Book, 2009).
Del mismo modo, los modelos de despliegue se pueden usar para hacer frente al estilo de respuesta , que se define como un patrón de categoría de respuesta consistente e independiente del contenido (por ejemplo, tendencia a estar de acuerdo con todas las declaraciones). En las ciencias sociales o en la literatura psicológica, esto se conoce como Extreme Response Style (ERS). Las referencias (1–3) pueden ser útiles para tener una idea de cómo se manifiesta y cómo se puede medir.
Aquí hay una breve lista de documentos que pueden ayudar a avanzar en este tema:
fuente
El análisis factorial exploratorio (EFA) es apropiado (psicométricamente y de otro modo) para examinar el grado en que uno puede explicar las correlaciones entre múltiples elementos al inferir la influencia común de (un) factor (es) no medido (es decir, latente). Si esta no es su intención específica, considere análisis alternativos, por ejemplo:
La dimensionalidad es el primer problema que EFA puede abordar. Puede examinar los valores propios de la matriz de covarianza (como al producir un gráfico de pantalla a través de EFA) y realizar un análisis paralelo para resolver la dimensionalidad de sus medidas. (Consulte también algunos excelentes consejos y sugerencias alternativas de William Revelle ). Debe hacerlo con cuidado antes de extraer un número limitado de factores y rotarlos en EFA, o antes de ajustar un modelo con un número específico de factores latentes usando CFA, SEM o similares. Si un análisis paralelo indica multidimensionalidad, pero su factor general (primero) supera ampliamente a todos los demás (es decir, tiene, con mucho, el mayor valor propio / explica la mayoría de la varianza en sus medidas), considere el análisis de bifactor (Gibbons y Hedeker, 1992;Reise, Moore y Haviland, 2010 ) .
Surgen muchos problemas en la EPT y el modelado de factor latente de las calificaciones de la escala Likert. Las escalas Likert producen datos ordinales (es decir, categóricos, politómicos, ordenados), no datos continuos. El análisis factorial generalmente asume que cualquier entrada de datos sin procesar es continua, y las personas a menudo realizan análisis factoriales de matrices de correlaciones momento-producto de Pearson, que solo son apropiadas para datos continuos. Aquí hay una cita de Reise y colegas (2010) :
Recomendaría combinar tanto el primer como el tercer enfoque (es decir, usar la estimación de mínimos cuadrados ponderados en diagonal en una matriz de correlación policórica), basado en la discusión de Wang y Cunningham (2005) de los problemas con alternativas típicas:
No me queda claro si la misma preocupación con la estimación de mínimos cuadrados ponderados se aplica a la estimación DWLS; independientemente, los autores recomiendan ese estimador. En caso de que no tenga los medios ya:
2.15.2
) para estos paquetes:psych
paquete (Revelle, 2013) contiene lapolychoric
función.fa.parallel
función puede ayudar a identificar la cantidad de factores a extraer.lavaan
paquete (Rosseel, 2012) ofrece la estimación DWLS para el análisis de variables latentes.semTools
paquete contiene lasefaUnrotate
,orthRotate
yoblqRotate
funciones.mirt
paquete (Chalmers, 2012) ofrece alternativas prometedoras utilizando la teoría de respuesta al ítem.Me imagino que Mplus (Muthén y Muthén, 1998-2011) también funcionaría, pero la versión demo gratuita no admitirá más de seis mediciones, y la versión con licencia no es barata. Sin embargo, puede valer la pena si te lo puedes permitir; ¡a la gente le encanta Mplus , y el servicio al cliente de Muthéns a través de sus foros es increíble!
Como se indicó anteriormente, la estimación DWLS supera el problema de las violaciones de la suposición de normalidad (tanto univariadas como multivariadas), que es un problema muy común y casi ubicuo en los datos de calificación de la escala Likert. Sin embargo, no es necesariamente un problema pragmáticamente consecuente; La mayoría de los métodos no son demasiado sensibles a las infracciones pequeñas (muy sesgadas) (cf. ¿Es la prueba de normalidad "esencialmente inútil"? ). La respuesta de @ chl a esta pregunta plantea puntos y sugerencias más importantes y excelentes sobre problemas con un estilo de respuesta extremo también; Definitivamente es un problema con las clasificaciones de escala Likert y otros datos subjetivos.
Referencias
· Babakus, E., Ferguson, JCE y Jöreskog, KG (1987). La sensibilidad del análisis confirmatorio del factor de máxima verosimilitud a las violaciones de la escala de medición y los supuestos de distribución. Journal of Marketing Research, 24 , 222–228.
· Byrne, BM (2006). Modelado de ecuaciones estructurales con EQS. Mahwah, Nueva Jersey: Lawrence Erlbaum.
· Chalmers, RP (2012). mirt: un paquete de teoría de respuesta a elementos multidimensional para el entorno R. Revista de software estadístico, 48 (6), 1–29. Recuperado de http://www.jstatsoft.org/v48/i06/ .
· Gibbons, RD y Hedeker, DR (1992). Análisis de bi-factor de ítems de información completa. Psychometrika, 57 , 423–436.
· Knol, DL y Berger, MPF (1991). Comparación empírica entre análisis factorial y modelos multidimensionales de respuesta a ítems. Investigación conductual multivariante, 26 , 457–477.
· Muthén, LK, y Muthén, BO (1998-2011). Guía del usuario de Mplus (6ª ed.). Los Ángeles, CA: Muthén y Muthén.
· Muthén, LK, y Muthén, BO (2009). Mplus (Versión 4.00). [Software de ordenador]. Los Angeles, CA: Autor. URL: http://www.statmodel.com .
· Olsson, U. (1979). Estimaciones de máxima verosimilitud para el coeficiente de correlación policórica. Psychometrika, 44 , 443–460.
·R Core Team. (2012) R: Un lenguaje y entorno para la computación estadística. Fundación R para la informática estadística, Viena, Austria. ISBN 3-900051-07-0, URL: http://www.R-project.org/ .
· Reise, SP, Moore, TM y Haviland, MG (2010). Modelos de bifactorios y rotaciones: explorar el grado en que los datos multidimensionales producen puntajes de escala unívocos. Revista de evaluación de la personalidad, 92 (6), 544–559. Recuperado de http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2981404/ .
· Revelle, W. (2013). Psych: procedimientos para la personalidad y la investigación psicológica. Northwestern University, Evanston, Illinois, Estados Unidos. Recuperado de http://CRAN.R-project.org/package=psych . Versión = 1.3.2.
· Rosseel, Y. (2012). lavaan: un paquete R para el modelado de ecuaciones estructurales. Revista de software estadístico, 48 (2), 1-36. Recuperado de http://www.jstatsoft.org/v48/i02/ .
· Wang, WC y Cunningham, EG (2005). Comparación de métodos de estimación alternativos en análisis factoriales confirmatorios del Cuestionario general de salud. Informes psicológicos, 97 , 3–10.
· Wirth, RJ y Edwards, MC (2007). Análisis factorial de ítems: enfoques actuales y direcciones futuras. Métodos psicológicos, 12 , 58-79. Recuperado de http://www.ncbi.nlm.nih.gov/pmc/articles/PMC3162326/ .
fuente
Solo una breve nota de que es posible que desee ver la correlación policórica con el análisis factorial en lugar de la matriz tradicional de correlación / covarianza.
http://www.john-uebersax.com/stat/sem.htm
fuente