¿En qué condiciones deben usarse las escalas Likert como datos ordinales o de intervalo?

52

Muchos estudios en ciencias sociales usan escalas Likert. ¿Cuándo es apropiado usar los datos de Likert como ordinales y cuándo es apropiado usarlos como datos de intervalo?

Un leon
fuente
66
Técnicamente, las escalas Likert son la suma de elementos de tipo Likert y, como tales, terminan siendo una aproximación razonable (al menos según muchos psicometristas en psicología) de un punto de datos de intervalo.
russellpierce
2
@drknexus - Entonces, ¿varios elementos sirven como una triangulación de medición para escalas de construcción? En caso afirmativo, ¿cuáles son los criterios para determinar que un investigador tiene suficientes puntos de datos relevantes (es decir, elementos) para usar la escala como una medición de intervalo?
Un león
2
No estoy seguro; Esa podría ser una pregunta digna para la comunidad en general. Supongo que probablemente sea en parte un juicio de valor por parte del investigador y el área. Algunas áreas están completamente dispuestas a tratar un solo elemento Likert como intervalo a pesar de que claramente es ordinal. Una respuesta razonable podría ser utilizar un método de análisis diferente, por ejemplo, una prueba de permutación o de arranque. Otra respuesta podría ser realizar una prueba simple de normalidad, siempre que el agregado no se aleje significativamente de la normalidad, probablemente esté bien.
russellpierce
1
... pero en general parece que uno podría evocar el teorema del límite central y sugerir que 20 a 30 ítems deberían ser suficientes para usar la escala como una medida de intervalo.
russellpierce

Respuestas:

41

Tal vez sea demasiado tarde, pero agrego mi respuesta de todos modos ...

Depende de lo que intente hacer con sus datos: si está interesado en mostrar que los puntajes difieren al considerar diferentes grupos de participantes (género, país, etc.), puede tratar sus puntajes como valores numéricos, siempre que cumplan con los supuestos habituales sobre la varianza (o forma) y el tamaño de la muestra. Si está bastante interesado en resaltar cómo varían los patrones de respuesta entre los subgrupos, entonces debe considerar los puntajes de los ítems como una elección discreta entre un conjunto de opciones de respuesta y buscar modelos log-lineales, regresión logística ordinal, modelos de respuesta a ítems o cualquier otro modelo estadístico que permite hacer frente a elementos politómicos.

Como regla general, generalmente se considera que tener 11 puntos distintos en una escala es suficiente para aproximar una escala de intervalo (para fines de interpretación, vea el comentario de @ xmjx). Los ítems Likert pueden considerarse como una verdadera escala ordinal, pero a menudo se usan como numéricos y podemos calcular su media o DE. Esto a menudo se realiza en encuestas de actitud, aunque es aconsejable informar tanto la media / DE como el% de respuesta en, por ejemplo, las dos categorías más altas.

Cuando se usan puntajes de escala sumados (es decir, sumamos puntaje en cada ítem para calcular un "puntaje total"), se pueden aplicar estadísticas habituales, pero debe tener en cuenta que ahora está trabajando con una variable latente, por lo que la construcción subyacente debería tener sentido! En psicometría, generalmente verificamos que (1) la unidimensionalidad de la escala se mantiene, (2) la confiabilidad de la escala es suficiente. Al comparar dos puntajes de escala de este tipo (para dos instrumentos diferentes), incluso podríamos considerar el uso de medidas de correlación atenuadas en lugar del coeficiente de correlación clásico de Pearson.

Los libros de texto clásicos incluyen:
1. Nunnally, JC y Bernstein, IH (1994). Teoría psicométrica (3ª ed.). Serie McGraw-Hill en Psicología.
2. Streiner, DL y Norman, GR (2008). Escalas de medición de salud. Una guía práctica para su desarrollo y uso (4ª ed.). Oxford
3. Rao, CR y Sinharay, S., Eds. (2007) Manual de estadísticas, vol. 26: Psicometría . Elsevier Science BV
4. Dunn, G. (2000). Estadística en psiquiatría . Hodder Arnold.

También puede echar un vistazo a Aplicaciones de rasgos latentes y modelos de clase latentes en las ciencias sociales , de Rost & Langeheine, y el sitio web de W. Revelle sobre investigación de la personalidad .

Al validar una escala psicométrica, es importante tener en cuenta los denominados efectos techo / suelo (gran asimetría resultante de que los participantes puntúen en la categoría de respuesta más baja / más alta), lo que puede afectar seriamente cualquier estadística calculada al tratarlos como variable numérica ( por ejemplo, agregación de país, prueba t). Esto plantea problemas específicos en los estudios interculturales, ya que se sabe que la distribución general de la respuesta en las encuestas de actitud o salud difiere de un país a otro (por ejemplo, los chinos frente a los que provienen de países occidentales tienden a resaltar un patrón de respuesta específico, el primero tiene generalmente puntuaciones más extremas a nivel de ítem, véase, por ejemplo, Song, X.-Y. (2007) Análisis de modelos de ecuaciones estructurales de múltiples muestras con aplicaciones a datos de Calidad de Vida, enManual de variables latentes y modelos relacionados , Lee, S.-Y. (Ed.), Pp 279-302, Holanda del Norte).

En términos más generales, debe consultar la literatura relacionada con la psicometría que hace un uso extensivo de los artículos de Likert si está interesado en el tema de la medición. Se han desarrollado varios modelos estadísticos y actualmente se encuentran bajo el marco de la Teoría de respuesta al ítem.

chl
fuente
2
Solo para aclarar: Nunnally / Bernstein sugiere tratar una variable como continua si tiene al menos 11 valores distintos (p. 115). ¿De dónde es esa regla general de "12 puntos implican escala de intervalo"?
xmjx
12

La respuesta simple es que las escalas Likert son siempre ordinales. Los intervalos entre las posiciones en la escala son monótonos pero nunca tan bien definidos como para ser incrementos numéricamente uniformes.

Dicho esto, la distinción entre ordinal e intervalo se basa en las demandas específicas del análisis que se realiza. En circunstancias especiales, puede tratar las respuestas como si cayeran en una escala de intervalos. Para hacer esto, generalmente los encuestados deben estar de acuerdo con respecto al significado de las respuestas de la escala y el análisis (o las decisiones tomadas con base en el análisis) deben ser relativamente insensibles a los problemas que puedan surgir.

Tom
fuente
8
John Tukey escribió lo contrario (en 1960) en una monografía "Análisis de datos y ciencias del comportamiento" (publicada en Collected Works v. III). Un resultado que obtuvo es que si está obteniendo un acuerdo de prueba-prueba de aproximadamente el 10%, ¡su escala no es lo suficientemente estrecha!
Whuber
Esta respuesta parece confundir las escalas de Likert con elementos de calificación originales. Ver el comentario de @ russellpierce.
rolando2
9

Además de lo que ya se ha dicho anteriormente sobre las escalas sumadas, también mencionaría que el problema puede cambiar al analizar los datos a nivel de grupo. Por ejemplo, si estuvieras examinando

  • satisfacción de vida de estados o países,
  • satisfacción laboral de organizaciones o departamentos,
  • satisfacción de los alumnos en las asignaturas.

En todos estos casos, cada medida agregada (quizás la media) se basa en muchas respuestas individuales (p. Ej., N = 50, 100, 1000, etc.). En estos casos, el elemento Likert original comienza a adquirir propiedades que se asemejan a una escala de intervalo a nivel agregado.

Jeromy Anglim
fuente
-2

escala likert siempre en forma ordinal: un método para atribuir valor cuantitativo a datos cualitativos, para que sea susceptible de análisis estadístico. Se asigna un valor numérico a cada opción potencial y se calcula una cifra media para todas las respuestas al final de la evaluación o encuesta.

mubashara hussain
fuente
55
¡Bienvenido a nuestro sitio! Por favor, atribuya su cita o, en general, cualquier palabra que esté tomando prestada de otra persona.
whuber