Me interesaría recibir sugerencias sobre cuándo usar " puntajes de factores " sobre la suma simple de puntajes al construir escalas. Es decir, "refinado" sobre los métodos "no refinados" de puntuación de un factor. De DiStefano et al. (2009; pdf ), énfasis agregado:
Hay dos clases principales de métodos de cálculo de puntaje factorial: refinado y no refinado. Los métodos no refinados son procedimientos acumulativos relativamente simples para proporcionar información sobre la ubicación de los individuos en la distribución de factores. La simplicidad se presta a algunas características atractivas, es decir, los métodos no refinados son fáciles de calcular y de interpretar. Los métodos de cálculo refinados crean puntajes de factores utilizando enfoques más sofisticados y técnicos. Son más exactos y complejos que los métodos no refinados y proporcionan estimaciones que son puntajes estandarizados.
En mi opinión, si el objetivo es crear una escala que se pueda utilizar en todos los estudios y entornos, entonces tiene sentido una simple suma o puntaje promedio de todos los ítems de la escala. Pero supongamos que el objetivo es evaluar los efectos del tratamiento de un programa y el contraste importante está dentro de la muestra: tratamiento versus grupo de control. ¿Hay alguna razón por la que podríamos preferir puntajes de factores a escalas de sumas o promedios?
Para ser concreto sobre las alternativas, tome este simple ejemplo:
library(lavaan)
library(devtools)
# read in data from gist ======================================================
# gist is at https://gist.github.com/ericpgreen/7091485
# this creates data frame mydata
gist <- "https://gist.github.com/ericpgreen/7091485/raw/f4daec526bd69557874035b3c175b39cf6395408/simord.R"
source_url(gist, sha1="da165a61f147592e6a25cf2f0dcaa85027605290")
head(mydata)
# v1 v2 v3 v4 v5 v6 v7 v8 v9
# 1 3 4 3 4 3 3 4 4 3
# 2 2 1 2 2 4 3 2 1 3
# 3 1 3 4 4 4 2 1 2 2
# 4 1 2 1 2 1 2 1 3 2
# 5 3 3 4 4 1 1 2 4 1
# 6 2 2 2 2 2 2 1 1 1
# refined and non-refined factor scores =======================================
# http://pareonline.net/pdf/v14n20.pdf
# non-refined -----------------------------------------------------------------
mydata$sumScore <- rowSums(mydata[, 1:9])
mydata$avgScore <- rowSums(mydata[, 1:9])/9
hist(mydata$avgScore)
# refined ---------------------------------------------------------------------
model <- '
tot =~ v1 + v2 + v3 + v4 + v5 + v6 + v7 + v8 + v9
'
fit <- sem(model, data = mydata, meanstructure = TRUE,
missing = "pairwise", estimator = "WLSMV")
factorScore <- predict(fit)
hist(factorScore[,1])
fuente
They are more exact
Este énfasis adicional no debería distraernos del hecho de que incluso los puntajes de los factores son inevitablemente inexactos ("subdeterminados")."more exact"
. Entre los puntajes de factores calculados linealmente, el método de regresión es más "exacto" en el sentido de "más correlacionado con los valores de factores verdaderos desconocidos". Entonces sí, más exacto (dentro del enfoque algebraico lineal), pero no totalmente exacto.Respuestas:
He estado luchando con esta idea yo mismo en algunos proyectos actuales. Creo que debes preguntarte qué se estima aquí. Si se ajusta un modelo de un factor, las puntuaciones de los factores estiman el factor latente. La suma o media directa de sus variables de manifiesto estima otra cosa, a menos que cada observación cargue por igual en el factor, y las unicidades también sean las mismas. Y esa otra cosa probablemente no sea una cantidad de gran interés teórico.
Entonces, si un modelo de un factor se ajusta, probablemente le aconsejen usar los puntajes de los factores. Considero su comparabilidad entre los estudios, pero dentro de un estudio en particular, creo que los puntajes de los factores tienen mucho para ellos.
Donde se pone interesante es cuando un modelo de un factor no se ajusta, ya sea porque se aplica un modelo de dos factores (o superior) o porque la estructura de covarianza es más complicada de lo que predice un modelo de factores. Para mí, la pregunta es si el total directo de las variables se refiere a algo real. Esto es particularmente cierto si los datos tienen más de una dimensión. En la práctica, lo que sucede a menudo es que tiene un montón de variables relacionadas (elementos en una encuesta, tal vez), con una o dos de ellas muy diferentes de las demás. Puedes decir "al infierno con esto" y tomar el promedio de todo, independientemente de lo que signifique. O puedes ir con las puntuaciones de los factores. Si se ajusta a un modelo de un factor, lo que generalmente sucederá es que el análisis factorial disminuirá las variables menos útiles (o al menos, aquellas variables que realmente pertenecen a un segundo puntaje de factor). En efecto, los identifica como pertenecientes a una dimensión diferente y los ignora.
Así que creo que el puntaje factorial puede podar los datos para dar algo más unidimensional de lo que comenzaste. Pero no tengo una referencia para esto, y todavía estoy tratando de descubrir en mi propio trabajo si me gusta este enfoque. Para mí, el gran peligro es sobreajustar cuando pasas los puntajes a otro modelo con los mismos datos. Los puntajes ya son la respuesta a una pregunta de optimización, entonces, ¿dónde deja eso el resto del análisis? Odio pensar
Pero al final del día, ¿tiene sentido una suma o un total de variables si algo como un modelo de un factor no se aplica?
Muchas de estas preguntas no surgirían si la gente diseñara mejores escalas para empezar.
fuente
one-factor model
. Solo me pregunto por qué. ¿Estás diciendo que en un modelo de 2 factores los puntajes de los factores ya noestimate the latent factor
? ¿Porque? Y también, ¿cómo define el "modelo de un factor" en el contexto de un cuestionario en desarrollo (el contexto probable de la Q): es que el cuestionario es de factor único / escala o que cada elemento incluido se cuenta perteneciendo estrictamente a un factor /¿escala? Por favor, ¿te importaría dejarlo más claro?Sumar o promediar elementos cargados por el factor común es una forma tradicional de calcular el puntaje de confianza (el constructo que representa el factor). Es una versión más simple del "método burdo" de calcular puntajes de factores ; El punto principal del método es el uso de cargas de factores como ponderaciones de puntaje. Mientras que los métodos refinados para calcular puntajes usan coeficientes de puntaje especialmente estimados (calculados a partir de las cargas) como los pesos.
Esta respuesta no universalmente "sugiere cuándo usar puntajes de factores [refinados] sobre la suma simple de puntajes de ítems", que es un dominio vasto, sino que se enfoca en mostrar algunas implicaciones obvias concretas, prefiriendo una forma de calcular la construcción sobre la otra camino.
Considere una situación simple con algún factor y dos elementos cargados por él. De acuerdo con la Nota 1 aquí explicando cómo se calculan las puntuaciones de los factores de regresión, los coeficientes de puntuación de los factores y para calcular las puntuaciones de los factores de provienenF b1 b2 F
donde y son las correlaciones entre el factor y los elementos: las cargas del factor; es la correlación entre los elementos. Los coeficientes son los que distinguen los puntajes de factores de la suma simple y no ponderada de los puntajes de los ítems. Porque, cuando calcula solo la suma (o media), establece deliberadamente ambas para que sean iguales. Mientras que en los puntajes de factores "refinados", las s se obtienen de las ecuaciones anteriores y generalmente no son iguales.s1 s2 r12 b b b
Para simplificar, y dado que el análisis factorial a menudo se realiza en correlaciones, tomemos las s como correlaciones, no covarianzas. Entonces y son unidades y pueden omitirse. Luego,r r11 r22
por tantob1−b2=−(r12+1)(s1−s2)r212−1.
Estamos interesados en cómo esta desigualdad potencial entre las s depende de la desigualdad entre las cargas s y la correlación . La función se muestra a continuación en la gráfica de superficie y también en una gráfica de mapa de calor.b s r12 b1−b2
Claramente, como las cargas son iguales ( ) los coeficientes también son iguales, siempre. A medida que crece, crece en respuesta, y cuanto más rápido, mayor es .s1−s2=0 b s1−s2 b1−b2 r12
Por lo tanto, si dos elementos se cargan por su factor aproximadamente por igual, puede establecer de manera segura sus pesos iguales, es decir, calcular la suma simple, porque los pesos (que determinan los puntajes de los factores de regresión) también son aproximadamente iguales. No se aleja mucho de los puntajes de factores (a).b
Pero considere dos cargas diferentes, digamos, y , la diferencia es . Si elige simplemente sumar los puntajes dados por un encuestado, el grado de equivocación de su decisión con respecto al puntaje del factor estimado depende de qué tan fuertemente se correlacionan los ítems entre sí. Si se correlacionan no muy fuertemente, su sesgo no es demasiado pronunciado (b). Pero si se correlacionan realmente fuerte, el sesgo también es fuerte, por lo que una suma simple no funcionará (c). Interpretando la razón en las tres situaciones:s1=.70 s2=.45 .25
C. Si se correlacionan fuertemente, el elemento cargado más débil es un duplicado junior del otro. ¿Cuál es la razón para contar ese indicador / síntoma más débil en presencia de su sustituto más fuerte? No hay mucha razón Y las puntuaciones de los factores se ajustan para eso (mientras que la suma simple no lo hace). Tenga en cuenta que en un cuestionario multifactorial, el "elemento cargado más débil" es a menudo el elemento de otro factor, cargado más alto allí; mientras que en el factor presente este elemento se restringe, como vemos ahora, en el cálculo de los puntajes de los factores, y eso es correcto.
si. Pero si los artículos, aunque cargados como antes de manera desigual, no se correlacionan tan fuertemente, entonces son indicadores / síntomas diferentes para nosotros. Y podría contarse "dos veces", es decir, solo sumarse. En este caso, los puntajes de los factores intentan respetar el elemento más débil en la medida en que su carga aún lo permite, ya que es una forma de realización diferente del factor.
a. También se pueden contar dos ítems dos veces, es decir, simplemente sumados, siempre que tengan cargas similares, suficientemente altas, por el factor, cualquiera que sea la correlación entre estos ítems. (Los puntajes de factor agregan más peso a ambos elementos cuando se correlacionan no demasiado apretados, sin embargo, los pesos son iguales). No parece irrazonable que generalmente toleremos o admitamos elementos bastante duplicados si todos están fuertemente cargados. Si no le gusta esto (a veces es posible que desee), puede eliminar los duplicados del factor manualmente.
Por lo tanto, en el cálculo de las puntuaciones de los factores (refinados) (al menos por el método de regresión), aparentemente existen intrigas de "llevarse bien / salir" entre las variables que constituyen el constructo, en su influencia en las puntuaciones . Los indicadores igualmente fuertes se toleran entre sí, como también lo hacen los indicadores desigualmente fuertes y no fuertemente correlacionados. El "cierre" ocurre con un indicador más débil fuertemente correlacionado con indicadores más fuertes. La suma / promediación simple no tiene esa intriga de "eliminar un duplicado débil".
Por favor, vea también esta respuesta que advierte que el factor teóricamente es más una "esencia interna" que una colección o montón de "sus" fenómenos indicativos. Por lo tanto, resumir a ciegas los elementos, sin tener en cuenta ni sus cargas ni sus correlaciones, es potencialmente problemático. Por otro lado, el factor, como se calificó, puede ser solo una especie de suma de sus elementos, por lo que todo se trata de una mejor concepción de los pesos en la suma.
Echemos un vistazo también a la deficiencia del método grueso o de suma más general y abstracto .
Al comienzo de la respuesta, he dicho que obtener un puntaje de construcción a través de la suma / promediación simple es un caso particular del método aproximado de cálculo de puntaje de factor por el cual los coeficientes de puntaje s se reemplazan por cargas de factor s (cuando las cargas entran dicotomizadas como 1 (cargado) y 0 (descargado) obtenemos exactamente esa simple suma o promedio de elementos).b a
Supongamos es un puntaje de factor de encuestado (estimación del valor) y es su valor de factor verdadero (siempre desconocido). También sabemos que cada uno de los elementos y cargados por el factor común (con las cargas y ) consisten en ese factor común más el factor único (suponemos que este último comprende el factor específico S y el término de error e). Entonces, al calcular los puntajes de los factores como lo hacen los paquetes a través de s, tenemosF^i i Fi X1 X2 a1 a2 F U b
Si está cerca de cero y son equivalentes. A menos que los factores únicos estén completamente ausentes (o a menos que conozcamos sus valores, lo que no sabemos) nunca podremos proporcionar puntajes que reflejen los valores de precisión. Sin embargo, podríamos idear los dos coeficientes de tal manera que sea posiblemente mínimo entre los encuestados; entonces se guardan estrecha correlación con . Un método u otro, al estimar los coeficientes de puntaje s de las cargas s y los valoresb1U1i+b2U2i F^i Fi U F^ F b var[b1U1i+b2U2i] F^ F b a X podemos hacer puntajes ser bastante representativo de .F^ F
Pero observe el "método grueso", donde las cargas s se admiten en lugar de s a la aproximación anterior de por :a b F F^
Lo que vemos aquí es la ponderación de factores únicos por esos mismos coeficientes que son el grado en que las variables son ponderadas por el factor común . Arriba, las s se calcularon con la ayuda de s, cierto, pero no eran s en sí mismas; y ahora 's en sí mismos llegaron a peso, ya que son - a peso lo que se refiere a no . Esta es la crudeza que cometemos cuando usamos el "método aproximado" de cálculo de puntaje factorial, incluida la suma / promediación simple de ítems como su variante específica.a a ab a a a
fuente
Use "validated" scales
no requiere necesariamente sumas simples: si la validación fue buena (muestra grande representativa, buenas correlaciones, número correcto de factores, ajuste agradable, etc.), los puntajes de los factores calculados (sus coeficientes) pueden tomarse como normativos pesos para ser utilizados en nuevas poblaciones. A este respecto, no veo ninguna ventaja en la suma simple.