Nunca me ha gustado cómo las personas suelen analizar datos de escalas Likert como si el error fuera continuo y gaussiano cuando hay expectativas razonables de que estos supuestos se violen al menos en los extremos de las escalas. ¿Qué opinas de la siguiente alternativa:
Si la respuesta toma el valor en una escala de puntos, expanda esos datos a ensayos, de los cuales tienen el valor 1 y del valor 0. Por lo tanto, estamos tratando la respuesta en una escala Likert como si es el agregado manifiesto de una serie encubierta de ensayos binomiales (de hecho, desde una perspectiva de ciencia cognitiva, este es realmente un modelo atractivo para los mecanismos involucrados en tales escenarios de toma de decisiones). Con los datos expandidos, ahora puede usar un modelo de efectos mixtos que especifica el encuestado como un efecto aleatorio (también pregunta como efecto aleatorio si tiene varias preguntas) y usar la función de enlace binomial para especificar la distribución de errores.n n k n - k
¿Alguien puede ver alguna violación de suposición u otros aspectos perjudiciales de este enfoque?
fuente
Respuestas:
No conozco ningún artículo relacionado con su pregunta en la literatura psicométrica. Me parece que los modelos logísticos ordenados que permiten componentes de efectos aleatorios pueden manejar esta situación bastante bien.
Estoy de acuerdo con @Srikant y creo que un modelo de probabilidades proporcionales o un modelo probit ordenado (dependiendo de la función de enlace que elija) podría reflejar mejor la codificación intrínseca de los elementos Likert y su uso típico como escalas de calificación en encuestas de opinión / actitud o cuestionarios .
Otras alternativas son: (1) el uso de categorías adyacentes en lugar de proporcionales o acumulativas (donde hay una conexión con modelos log-lineales); (2) uso de modelos de respuesta al ítem como el modelo de crédito parcial o el modelo de escala de calificación (como se mencionó en mi respuesta en el análisis de escalas Likert ). El último caso es comparable a un enfoque de efectos mixtos, con sujetos tratados como efectos aleatorios, y está fácilmente disponible en el sistema SAS (p. Ej., Modelos de ajuste de efectos mixtos para resultados ordinales repetidos con el procedimiento NLMIXED ) o R (ver vol. 20 de la Revista de Software Estadístico ). También podría estar interesado en la discusión brindada por John Linacre sobre Optimización de la efectividad de la categoría de escala de calificación .
Los siguientes documentos también pueden ser útiles:
fuente
Si realmente desea abandonar la suposición de datos de nivel de intervalo para escalas likert, le sugiero que suponga que los datos son un logit o probit ordenado. Las escalas Likert generalmente miden la fuerza de la respuesta y, por lo tanto, los valores más altos deberían indicar una respuesta más fuerte en el elemento de interés subyacente.
Suponga que tiene una escala de ítem y que representa la fuerza de respuesta no observada en el ítem de interés. Entonces puede asumir el siguiente modelo de respuesta:SH S
S ≤ α 1y=1 siS≤α1
α h - 1 < S ≤ α h h = 2 , 3 , . . H - 1y=h if paraαh−1<S ≤αh h=2,3,..H−1
α H - 1 < S < ∞y=H ifαH−1<S< ∞
Suponiendo que sigue una distribución normal con una media y varianza desconocidas, se obtendría un modelo probit ordenado.S
fuente
Una preocupación sería que al usar este enfoque, está imponiendo una relación específica entre la media y la varianza de la respuesta. Para el tipo de encuestas a menudo se usan escalas Likert, por ejemplo, usted elige una de las cinco categorías entre "Totalmente de acuerdo" y "Totalmente en desacuerdo" con respecto a alguna afirmación u otra, me parece mal. Por ejemplo, esperaría que una escala de diez puntos ofrezca aproximadamente la misma distribución de respuestas que una escala de cinco puntos si contrae pares de categorías adyacentes: para una respuesta & commonnp np(1−p) y p
fuente
Puede usar la aproximación binomial en una escala Likert de 5 puntos si combina el acuerdo y el acuerdo total en un grupo y el desacuerdo y el desacuerdo total en otro. Por supuesto, aún debes decidir a dónde van los neutrales. Pondría los neutrales en cualquier grupo, usaría la aproximación normal al binomio (siempre que tenga más de 40 respuestas) y desarrolle intervalos de confianza en las proporciones de cada grupo (vea cualquier texto estándar de estadísticas sobre cómo obtener conf. intervalos en proporciones procedentes de una distribución binomial con la aproximación normal). Luego, pondría a los neutrales en el otro grupo y rehacería los intervalos de confianza. Si obtengo la misma conclusión de ambos, entonces hay una conclusión potencial. De lo contrario, no veo cómo se puede usar el binomio con los datos de Likert.
fuente
Si entendí correctamente, este documento sugiere un enfoque muy similar a lo que ha descrito, sugiriendo que sí, de hecho, los datos tipo Likert pueden surgir de un proceso binomial.
Referencia completa: Allik, J. (2014). Un modelo binomial mixto para medidas de personalidad tipo Likert. Fronteras en psicología , (5) 371
fuente
En realidad, estoy preparando un documento en el que estoy usando su enfoque de tratar una respuesta en un elemento similar como si fuera el agregado manifiesto de una serie encubierta de ensayos binomiales.
En mi trabajo, la distribución binomial se usa para explicar la forma de las distribuciones de frecuencia observadas. La razón detrás de este enfoque viene dada por dos supuestos. En muchos applets, que muestran cómo se produce la distribución binomial, uno ha repetido ensayos independientes de Bernoulli con una sola bola que cae a través de una serie de alfileres. Cada vez que una pelota cae sobre un alfiler, rebota hacia la derecha (es decir, un éxito) con probabilidad p o hacia la izquierda (es decir, un fallo) con probabilidad 1-p. Después de que la bola cae a través de la matriz, aterriza en un contenedor etiquetado por el número correspondiente de éxitos. En mi trabajo, el proceso de toma de decisiones también se ve como una serie de ensayos independientes repetidos de Bernoulli en los que, en cada ensayo, el sujeto decide aceptar o no la declaración en cuestión.
(i) En cada ensayo independiente de Bernoulli, el sujeto toma la decisión de estar de acuerdo con la probabilidad p o no estar de acuerdo (en desacuerdo) con la probabilidad 1-p.
(ii) Si hay cinco categorías de respuesta disponibles para la declaración, el número de veces que se toma una decisión de Bernoulli con respecto a la decisión de aceptar o no (no estar de acuerdo) es igual a 4 (5-1).
La elección final para una categoría de respuesta específica está dada por las siguientes reglas.
Si en los (cuatro) casos se toma una decisión de acuerdo de Bernoulli, se dará la respuesta 'totalmente de acuerdo'.
Si en tres casos se toma una decisión de acuerdo de Bernoulli, se dará la respuesta 'de acuerdo'.
Si en dos casos se toma una decisión de acuerdo de Bernoulli, se dará la respuesta 'indeciso'.
Si en un solo caso se toma una decisión de acuerdo de Bernoulli, se dará la respuesta "en desacuerdo".
Si en ningún caso se toma una decisión de acuerdo de Bernoulli, se dará la respuesta "totalmente en desacuerdo".
Se puede dar un razonamiento similar utilizando decisiones "en desacuerdo". Para obtener una distribución binomial, la puntuación de las categorías de respuesta es la siguiente.
totalmente en desacuerdo = 0, en desacuerdo = 1, neutral = 2, de acuerdo = 3, totalmente de acuerdo = 4
Estos dos supuestos conducen a una distribución binomial para las frecuencias de respuesta, siempre que no haya diferencias sistemáticas entre los encuestados.
Espero que puedas estar de acuerdo. Apreciaría mucho si pudieras mejorar mi inglés en el texto anterior.
fuente