¿Es 0 un valor válido en una escala Likert?

8

He llevado a cabo mi estudio piloto sobre la motivación del aprendizaje de idiomas utilizando una escala Likert de 6 puntos, pero de 0 (muy en desacuerdo) a 5 (muy de acuerdo). Noté que un colega en su encuesta usó del 1 al 6. ¿Mis variables calculadas (suma y media) serán las mismas que si hubiera usado del 1 al 6? ¿Se recomienda normalmente no usar un 0 por alguna razón? Soy nuevo en SPSS pero he logrado hacer la mayor parte de lo que tengo que hacer, pero ahora me preocupa que mis valores estén 'distorsionados'. No entiendo cómo SPSS agrega un 0 en una ecuación.

Imelda
fuente
66
Sospecho, pero sin poder ofrecer evidencia, que puede haber una diferencia psicológica entre las escalas 1..6 y 0..5, principalmente debido a las diferencias en cómo las personas experimentan y entienden el 0 en comparación con sus percepciones de enteros positivos, y tal vez porque las personas pueden estar pensando en términos relativos al máximo, de modo que en un caso el cambio de 5 a 6 es 1/6 del máximo, mientras que en el otro caso sería (erróneamente) considerado igual a 1/5 del máximo. ¿Quizás los psicólogos en nuestra comunidad podrían ofrecer algunas ideas sobre esto?
whuber
2
@whuber De hecho, este es un tema de larga data en el diseño de cuestionarios, especialmente en lo que respecta a escalas uni vs. bipolares. Para una descripción general, vea Schwarz. 1996. Cognición y comunicación: sesgos de juicio, métodos de investigación y la lógica de la conversación. Mahwah, Nueva Jersey: Lawrence Erlbaum. Algunas referencias más .
caracal
77
A menudo se usan elementos de tipo Likert de 5 puntos, donde las categorías de respuesta son "Totalmente en desacuerdo", "Desacuerdo", "Ni ag. Ni desacuerdo", "Ag." Y "Fuertemente ag.", Sin números explícitos. Puntuación. ¿Cuál es tu sexta categoría? La codificación de respuesta es irrelevante, para regresión, verificación de datos o estadísticas resumidas. Cualquier método de escala, enlace o ecuación puede tener eso en cuenta. Lo que realmente importa es el modelo de medición subyacente que está listo para asumir, porque determinará si los puntajes deben tratarse como puntajes discretos dependientes de la muestra o como un 'reflejo' de un rasgo latente en una escala discreta.
chl
Soy el cartel de la pregunta original. El cuestionario completo sobre motivación estaba compuesto por 80 ítems agrupados en 16 subescalas con una medida de criterio de esfuerzo intensificado también clasificada en la escala likert. Todas las respuestas fueron de 0 (totalmente en desacuerdo) a 5 (totalmente de acuerdo). Muchas gracias a todos por las perspicaces respuestas, en base a estas mantuve la calificación original.

Respuestas:

8

Déjame hacer un par de puntos. Primero, si solo tiene 1 pregunta, técnicamente no tiene una escala likert , sino solo una calificación ordinal. En cualquier caso, no puedo ver cómo habrá una diferencia significativa. Esto es solo un cambio lineal. Esto no hará ninguna diferencia si usa un análisis ordinal como la regresión logística ordinal o una prueba U de Mann-Whitney, o una opción más estándar como la regresión OLS o una prueba t.

gung - Restablece a Monica
fuente
7

Debo estar parcialmente en desacuerdo con @MichaelChernick. Si bien las respuestas a una sola pregunta Likert (ya sea 0 a 5 o 1 a 6 o lo que sea) son claramente ordinales, generalmente hay una suma de varios elementos de la escala Likert. En algún momento, el número de valores posibles se vuelve tan alto que es esencialmente continuo.

Como usted sabe (pero el póster de la pregunta puede no serlo), la regresión OLS no supone que la variable dependiente esté normalmente distribuida, solo que los errores (según lo estimado por los residuos) sí lo son.

Si sumamos un montón de elementos Likert, ¿sabemos que los intervalos son realmente iguales? No en realidad no. ¿Pero sabemos eso para, por ejemplo, IQ? O incluso los ingresos? ¿Es la diferencia entre un coeficiente intelectual de 130 y 140 lo mismo que 100 y 110? ¿Esa pregunta tiene sentido? ¿Qué pasa con un aumento de $ 10,000 para alguien que gana $ 10,000 frente a $ 100,000 por año?

Escribí una publicación de blog completa sobre esto.

Además, no me queda claro si esta escala Likert será una variable dependiente o independiente.

Peter Flom
fuente
Supongo que depende de si el OP quiere comparar preguntas individuales o grupos de preguntas (comúnmente llamados dominios en la literatura de la encuesta). Pero, ¿cómo se vuelven continuas las sumas de enteros? Son más grandes pero siguen siendo enteros y no continuos. Además, la suma no cambia mágicamente de ordinal a nominal, así que no entiendo lo que estás tratando de decir. OLS supone que las covariables son fijas y que los residuos son normales. En efecto, eso significa que la variable dependiente condicionada en las covariables es normal.
Michael R. Chernick
2
@Michael Es posible que desee ver algunas discusiones anteriores sobre si tratar las escalas Likert como continuas o discretas . La puntuación variable a veces refleja la forma en que visualizamos los datos. También puedo recomendar De Boeck, P., Wilson, M. y Acton, GS (2005). Un marco conceptual y psicométrico para distinguir categorías y dimensiones . Revisión psicológica , 112 (1): 129-158.
chl
5

Al seguir las sugerencias de referencia de @ caracal, encontré una respuesta casi directa ( no, estos dos sistemas de calificación no son equivalentes si se presentan como opciones numéricas para los encuestados ) de Schwarz, Knäuper, Hippler, Noelle-Neumann y Clark (1991) . Presentan datos sobre las respuestas a la pregunta, "¿Hasta qué punto has tenido éxito en la vida hasta ahora?" Una versión dio opciones de calificación de 0-10 a 480 participantes; la otra versión tenía opciones de (-5) - (+ 5) con cero como punto medio, y fue vista por 552 participantes. Los puntos finales fueron etiquetados como "nada exitoso" y "extremadamente exitoso" en ambas versiones. "Indeciso" también era una opción para ambos. Así es como las cosas se sacudieron:

Escala 0-10-5 5 a +5 escalaValor de escalaPorcentajeAcumulativoValor de escalaPorcentajeAcumulativo0 0......-5 5111......-4 4...1222-31235 57 7-2134 47 714-114 45 520340 09 9136 61448+19 9227 72068+2234582088+335809 96 694+4 4149410397+5 54 498Indeciso3100UnorteremiCyoremire2100

Muy diferente, claramente! También informan para esta diferencia. Por supuesto, esta diferencia no aparecerá si la diferencia es solo detrás de escena en términos de cómo codifica las respuestas, no visible para los participantes como una forma de proporcionar respuestas.χ2(10)=105,1,pags<.0001


Existen métodos simples de diseño de encuestas que le permiten a uno evitar preocuparse por los efectos psicológicos de equiparar los anclajes de calificación con los números. Básicamente, ¡puedes evitar usar números! P.ej:

  1. Permita que los encuestados marquen las celdas en una tabla correspondiente a su preferencia de respuesta: cada fila puede ser un elemento diferente y cada columna puede etiquetarse con su ancla de calificación, o viceversa, sin números involucrados. Así es como podría verse (si uno respondiera sabiamente):

    Muy en desacuerdoDiscreparLigeramente en desacuerdoDe acuerdo levementeDe acuerdoTotalmente de acuerdoVasos: ¡mejor que bombeadores!Me veo gorda en este vestido. *

    Wikipedia da otro estilo usando opciones marcadas (por Nicholas Smith ):

  2. Los códigos de letras también se pueden sustituir por opciones numéricas si se deben llenar espacios en blanco para una lista de muchos elementos; por ejemplo, { SD, D, MD, MA, A, SA}. ¡Solo no olvides incluir la leyenda!


Referencia
Schwarz, N., Knäuper, B., Hippler, HJ, Noelle-Neumann, E. y Clark, L. (1991). Los valores numéricos de las escalas de calificación pueden cambiar el significado de las etiquetas de las escalas. Public Opinion Quarterly, 55 (4), 570–582.

Nick Stauner
fuente
¿Alguna razón para ver innumerables escalas como mejores ?
Scortchi - Restablece a Monica
1
@Scortchi: al menos deberían disminuir la ambigüedad de las respuestas. Me parece improbable que los encuestados y los investigadores logren una mejor comprensión mutua mezclando los lenguajes de los anclajes verbales y numéricos. Parece más probable que los investigadores diseñen sus índices de manera arbitraria e ingenua, y los encuestados decidirán cómo responder de manera inconsistente (en un sentido entre y dentro de los temas) basándose en el conjunto de anclajes que tenga más sentido para ellos en general, o peor, para ciertos artículos . Gracias por tu perspicaz edición, por cierto. ¡Ojo agudo!
Nick Stauner
1
Esto es solo mi intuición hablando ahora, por cierto, pero por ejemplo, un elemento como "Esta es una buena respuesta", podría atraer más a una escala de 0 a 10 por asociación con el típico sistema de calificación académica que varía de 0 a 100% de crédito ... mientras que "Obama es un buen presidente", podría atraer más a un sistema (-5) - (+ 5) porque les daría a los conservadores una forma de expresar su sensación de daño, no solo su insatisfacción. Mi conjetura es que la última pregunta no produciría ninguna preferencia entre los sistemas de calificación verbal y numérica, mientras que el sistema numérico podría preferirse ligeramente para la primera pregunta ...
Nick Stauner
1
... solo en términos de cómo las personas pensarían acerca de sus opciones de respuesta, sus elecciones entre los sistemas de calificación verbal y numérica probablemente se hagan en un nivel preconsciente / automático / menos deliberado con mayor frecuencia entre los participantes con diversos grados de autoconciencia , atención al detalle o " mentalidad psicológica ". Cierta cantidad de aprendizaje ocurre en el transcurso de completar un cuestionario largo. IIRC, esto lleva a respuestas más consistentes (quizás sesgadas) a medida que los elementos comienzan a desdibujarse juntos. </ especulación y conjetura salvaje>
Nick Stauner
1
Todo eso suena muy plausible. Admito que estaba buscando otro estudio para abordar la cuestión. (Recuerdo uno que pretendía mostrar la existencia de un efecto de "estar cercado" en el que el nivel medio de un elemento con un número impar estaba sobrerrepresentado en comparación con los dos niveles medios de un elemento con un número par). . - Publicaré el ref. Cuando lo encuentre.)
Scortchi - Restablezca a Monica
2

Para hacer análisis con escalas ordinales como Likert, usaría métodos no paramétricos basados ​​en rangos. Lo que importa con las escalas ordinales es el orden si 5 es mejor, 0 es peor, 1 es mejor que 0, 2 es mejor que 1, etc. Tanto las proporciones como los intervalos no tienen sentido para los datos ordinales. Por lo tanto, una escala de 1-6 versus 0-5 no importa y no afectará el análisis. Comenzar con 1 se debe a la tradición más que a la necesidad.

Michael R. Chernick
fuente
2
"Tanto las proporciones como los intervalos no tienen sentido para los datos ordinales" depende del modelo de medición subyacente que esté dispuesto a asumir.
chl
@Chl ¿Cuál es tu punto?
Michael R. Chernick
3
Mi punto es que ciertos modelos psicométricos consideran explícitamente la respuesta discreta como un proxy que refleja la ubicación (o responsabilidad) de uno en un rasgo latente, como se detalla en una respuesta mía . Estoy de acuerdo con el resto de su respuesta, que se basa básicamente en la idea de tratar los puntajes de suma (no en este caso, pero obtendrá la idea) como medios para clasificar a los individuos en una construcción dada (bajo el marco de CTT )
chl
3
Pero las variables generalmente no son estrictamente ordinales o de intervalo. La aplicación ciega de la taxonomía de Stevens es tan mala como la aplicación ciega de cualquier otra regla. Para estrictamente ordinal, podría codificarlo a 0, 2, 2.1, 2.2, 2.3, 19288191. ¿Pero lo haría ? Y, aparte de las mediciones físicas, ¿qué es realmente el intervalo?
Peter Flom
2
@ Peter Esto me recuerda a este hilo anterior: ¿Tiene sentido tratar los datos categóricos como continuos?
chl
-1

Creo que los puntos deberían determinarse según la formulación de las preguntas. De la misma manera, si las preguntas están relacionadas con la actitud, entonces los puntos deben asignarse del 1 al 5, no del 0 al 4 porque estamos tratando de conocer la actitud. Y la actitud no puede ser mentira a nivel 0; incluso la marca del encuestado en la opción Totalmente en desacuerdo, pero no podemos mencionar 0 (cero) en esta respuesta. Similar puede ser otras variables. Entonces, como investigador deberíamos tratar de determinar los puntos del 1 al 5; 1-7 etc.

Jiten
fuente