¿Cuáles son buenas estadísticas básicas para usar para datos ordinales?

67

Tengo algunos datos ordinales obtenidos de las preguntas de la encuesta. En mi caso, son respuestas de estilo Likert (Muy en desacuerdo-En desacuerdo-Neutral-De acuerdo-Muy de acuerdo). En mis datos están codificados como 1-5.

No creo que los medios signifiquen mucho aquí, entonces, ¿qué resumen de estadísticas básicas se consideran útiles?

PaulHurleyuk
fuente
2
Las opciones comunes incluyen - medianas, modos, proporciones o proporciones acumulativas en cada grupo
Glen_b

Respuestas:

29

Una tabla de frecuencias es un buen lugar para comenzar. Puede hacer el recuento y la frecuencia relativa para cada nivel. Además, el recuento total y el número de valores faltantes pueden ser útiles.

También puede usar una tabla de contingencia para comparar dos variables a la vez. También se puede mostrar usando un diagrama de mosaico.

Neil McGuigan
fuente
32

Voy a argumentar desde una perspectiva aplicada que la media es a menudo la mejor opción para resumir la tendencia central de un elemento Likert. Específicamente, estoy pensando en contextos como encuestas de satisfacción estudiantil, escalas de investigación de mercado, encuestas de opinión de empleados, ítems de pruebas de personalidad y muchos ítems de encuestas de ciencias sociales.

En tales contextos, los consumidores de investigación a menudo quieren respuestas a preguntas como:

  • ¿Qué afirmaciones tienen más o menos acuerdo en relación con los demás?
  • ¿Qué grupos estuvieron más o menos de acuerdo con una declaración dada?
  • Con el tiempo, ¿el acuerdo ha subido o bajado?

Para estos fines, la media tiene varios beneficios:

1. La media es fácil de calcular:

  • Es fácil ver la relación entre los datos sin procesar y la media.
  • Es pragmáticamente fácil de calcular. Por lo tanto, la media puede integrarse fácilmente en los sistemas de informes.
  • También facilita la comparabilidad entre contextos y entornos.

2. La media es relativamente bien entendida e intuitiva:

  • La media se usa a menudo para informar la tendencia central de los artículos Likert. Por lo tanto, los consumidores de investigación son más propensos a comprender la media (y, por lo tanto, confiar en ella y actuar en consecuencia).
  • Algunos investigadores prefieren la opción, posiblemente más intuitiva, de informar el porcentaje de la muestra que responde 4 o 5. Es decir, tiene la interpretación relativamente intuitiva de "acuerdo porcentual". En esencia, esta es solo una forma alternativa de la media, con 0, 0, 0, 1, 1codificación.
  • Además, con el tiempo, los consumidores de investigación crean marcos de referencia. Por ejemplo, cuando compara su rendimiento docente de un año a otro, o en todas las materias, desarrolla un sentido matizado de lo que indica una media de 3.7, 3.9 o 4.1.

3. La media es un número único:

  • Un solo número es particularmente valioso, cuando desea hacer afirmaciones como "los estudiantes estaban más satisfechos con la asignatura X que con la asignatura Y".
  • También encuentro, empíricamente, que un solo número es en realidad la información principal de interés en un artículo Likert. La desviación estándar tiende a estar relacionada con la medida en que la media está cerca del puntaje central (p. Ej., 3.0). Por supuesto, empíricamente, esto puede no aplicarse en su contexto. Por ejemplo, leí en alguna parte que cuando las calificaciones de You Tube tenían el sistema estelar, había una gran cantidad de las calificaciones más bajas o más altas. Por esta razón, es importante inspeccionar las frecuencias de categoría.

4. No hace mucha diferencia

  • Aunque no lo he probado formalmente, supondría la hipótesis de que con el fin de comparar las calificaciones de tendencia central entre los ítems, o grupos de participantes, o con el tiempo, cualquier elección razonable de escala para generar la media arrojaría conclusiones similares.
Jeromy Anglim
fuente
44
¡Buen post! ¿Tiene alguna idea sobre cómo diferentes culturas / países pueden usar escalas likert que impactarían drásticamente este tipo de resultados?
Chase
@chase Hay investigaciones sobre esto, pero ha pasado un tiempo desde que lo vi. Aquí hay un ejemplo de búsqueda en Google scholar scholar.google.com.au/…
Jeromy Anglim
Estoy de acuerdo con la justificación del Sr. Jeromy Anglim sobre el uso de la media (es decir, la media ponderada para ser exactos) como la interpretación más descriptiva imparcial más confiable de las variables categóricas ordenadas, como el uso de la escala Likert donde cada uno de los puntos de datos contribuye a la promedio final
28

Para resúmenes básicos, estoy de acuerdo en que las tablas de frecuencia de informes y alguna indicación sobre la tendencia central está bien. Por inferencia, un artículo reciente publicado en PARE discutió la prueba t vs. MWW, elementos Likert de cinco puntos: prueba t versus Mann-Whitney-Wilcoxon .

Para un tratamiento más elaborado, recomendaría leer la revisión de Agresti sobre variables categóricas ordenadas:

Liu, Y y Agresti, A (2005). El análisis de datos categóricos ordenados: una visión general y una encuesta de desarrollos recientes . Sociedad de Estadística e Investigación Operativa Test , 14 (1), 1-73.

Se extiende en gran medida más allá de las estadísticas habituales, como el modelo basado en el umbral (por ejemplo, odds ratio proporcional), y vale la pena leerlo en lugar de Agresti. libro CDA .

A continuación muestro una imagen de tres formas diferentes de tratar un artículo Likert; de arriba a abajo, la vista de "frecuencia" (nominal), la vista "numérica" ​​y la vista "probabilística" (un modelo de crédito parcial ):

texto alternativo

Los datos provienen de los Sciencedatos del ltmpaquete, donde el ítem se refería a la tecnología ("La nueva tecnología no depende de la investigación científica básica", con la respuesta "totalmente en desacuerdo" a "totalmente de acuerdo", en una escala de cuatro puntos)

chl
fuente
14

La práctica convencional es utilizar la suma de rango de estadísticas no paramétricas y el rango medio para describir datos ordinales.

Así es como funcionan:

Suma de rango

  • asignar un rango a cada miembro en cada grupo;

  • por ejemplo, suponga que está mirando goles para cada jugador en dos equipos de fútbol opuestos y luego clasifique a cada miembro en ambos equipos del primero al último;

  • calcular la suma de rango agregando los rangos por grupo ;

  • la magnitud de la suma de rango te dice cuán juntos están los rangos para cada grupo

Rango medio

M / R es una estadística más sofisticada que R / S porque compensa los tamaños desiguales en los grupos que está comparando. Por lo tanto, además de los pasos anteriores, divide cada suma por el número de miembros en el grupo.

Una vez que tenga estas dos estadísticas, puede, por ejemplo, hacer una prueba z de la suma de rango para ver si la diferencia entre los dos grupos es estadísticamente significativa (creo que eso se conoce como la prueba de suma de rango de Wilcoxon , que es intercambiable, es decir, funcionalmente equivalente a la prueba U de Mann-Whitney).

Funciones de R para estas estadísticas (las que conozco, de todos modos):

wilcox.test en la instalación estándar de R

Meanranks en el paquete de manivelas

Doug
fuente
3

Basado en el resumen Este artículo puede ser útil para comparar varias variables que son escala Likert. Compara dos tipos de pruebas de comparación múltiple no paramétricas: una basada en rangos y otra basada en una prueba de Chacko. Incluye simulaciones.

Peter Flom - Restablece a Monica
fuente
En la actualidad, esto casi parece un comentario, @PeterFlom. Aunque la biblioteca digital ACM es probablemente menos susceptible a la descomposición del enlace, ¿le importaría decir algo sobre el artículo, tal vez un resumen de la información útil que proporciona?
gung - Restablece a Monica
2
Hola @gung No estaba seguro de dónde poner el comentario en este largo hilo. Agregué la cita aquí ya que la pregunta publicada hoy fue cerrada, y este artículo parece útil (y cubre cuestiones que no he visto en otro lugar)
Peter Flom - Restablece a Monica
2

Por lo general, me gusta usar la trama de mosaico. Puede crearlos incorporando otras covariables de interés (como: sexo, factores estratificados, etc.)

Teoría de Galois
fuente
2

Estoy de acuerdo con la evaluación de Jeromy Anglim. Recuerde que las respuestas de Likert son estimaciones: no está utilizando una regla perfectamente confiable para medir un objeto físico con dimensiones estables. La media es una medida poderosa cuando se usan tamaños de muestra razonables.

En negocios e investigación y desarrollo de productos, la media es, con mucho, la estadística más común utilizada con escalas Likert. Cuando uso escalas Likert, generalmente he elegido una medida que se adapta idealmente a la pregunta de investigación. Por ejemplo, si está hablando de "preferencia" o "actitudes", puede usar múltiples indicadores basados ​​en Likert, y cada indicador proporciona una perspectiva ligeramente diferente.

yoX

VARNOLD
fuente
1

Los "puntajes de caja" a menudo se usan para resumir datos ordinales, particularmente cuando se trata de anclajes verbales significativos. En otras palabras, puede informar "cuadro superior 2", el porcentaje que eligió ya sea "de acuerdo" o "totalmente de acuerdo".

Jonathan
fuente