Tengo algunos datos ordinales obtenidos de las preguntas de la encuesta. En mi caso, son respuestas de estilo Likert (Muy en desacuerdo-En desacuerdo-Neutral-De acuerdo-Muy de acuerdo). En mis datos están codificados como 1-5.
No creo que los medios signifiquen mucho aquí, entonces, ¿qué resumen de estadísticas básicas se consideran útiles?
descriptive-statistics
likert
ordinal-data
PaulHurleyuk
fuente
fuente
Respuestas:
Una tabla de frecuencias es un buen lugar para comenzar. Puede hacer el recuento y la frecuencia relativa para cada nivel. Además, el recuento total y el número de valores faltantes pueden ser útiles.
También puede usar una tabla de contingencia para comparar dos variables a la vez. También se puede mostrar usando un diagrama de mosaico.
fuente
Voy a argumentar desde una perspectiva aplicada que la media es a menudo la mejor opción para resumir la tendencia central de un elemento Likert. Específicamente, estoy pensando en contextos como encuestas de satisfacción estudiantil, escalas de investigación de mercado, encuestas de opinión de empleados, ítems de pruebas de personalidad y muchos ítems de encuestas de ciencias sociales.
En tales contextos, los consumidores de investigación a menudo quieren respuestas a preguntas como:
Para estos fines, la media tiene varios beneficios:
1. La media es fácil de calcular:
2. La media es relativamente bien entendida e intuitiva:
0, 0, 0, 1, 1
codificación.3. La media es un número único:
4. No hace mucha diferencia
fuente
Para resúmenes básicos, estoy de acuerdo en que las tablas de frecuencia de informes y alguna indicación sobre la tendencia central está bien. Por inferencia, un artículo reciente publicado en PARE discutió la prueba t vs. MWW, elementos Likert de cinco puntos: prueba t versus Mann-Whitney-Wilcoxon .
Para un tratamiento más elaborado, recomendaría leer la revisión de Agresti sobre variables categóricas ordenadas:
Se extiende en gran medida más allá de las estadísticas habituales, como el modelo basado en el umbral (por ejemplo, odds ratio proporcional), y vale la pena leerlo en lugar de Agresti. libro CDA .
A continuación muestro una imagen de tres formas diferentes de tratar un artículo Likert; de arriba a abajo, la vista de "frecuencia" (nominal), la vista "numérica" y la vista "probabilística" (un modelo de crédito parcial ):
Los datos provienen de los
Science
datos delltm
paquete, donde el ítem se refería a la tecnología ("La nueva tecnología no depende de la investigación científica básica", con la respuesta "totalmente en desacuerdo" a "totalmente de acuerdo", en una escala de cuatro puntos)fuente
La práctica convencional es utilizar la suma de rango de estadísticas no paramétricas y el rango medio para describir datos ordinales.
Así es como funcionan:
Suma de rango
asignar un rango a cada miembro en cada grupo;
por ejemplo, suponga que está mirando goles para cada jugador en dos equipos de fútbol opuestos y luego clasifique a cada miembro en ambos equipos del primero al último;
calcular la suma de rango agregando los rangos por grupo ;
la magnitud de la suma de rango te dice cuán juntos están los rangos para cada grupo
Rango medio
M / R es una estadística más sofisticada que R / S porque compensa los tamaños desiguales en los grupos que está comparando. Por lo tanto, además de los pasos anteriores, divide cada suma por el número de miembros en el grupo.
Una vez que tenga estas dos estadísticas, puede, por ejemplo, hacer una prueba z de la suma de rango para ver si la diferencia entre los dos grupos es estadísticamente significativa (creo que eso se conoce como la prueba de suma de rango de Wilcoxon , que es intercambiable, es decir, funcionalmente equivalente a la prueba U de Mann-Whitney).
Funciones de R para estas estadísticas (las que conozco, de todos modos):
wilcox.test en la instalación estándar de R
Meanranks en el paquete de manivelas
fuente
Basado en el resumen Este artículo puede ser útil para comparar varias variables que son escala Likert. Compara dos tipos de pruebas de comparación múltiple no paramétricas: una basada en rangos y otra basada en una prueba de Chacko. Incluye simulaciones.
fuente
Por lo general, me gusta usar la trama de mosaico. Puede crearlos incorporando otras covariables de interés (como: sexo, factores estratificados, etc.)
fuente
Estoy de acuerdo con la evaluación de Jeromy Anglim. Recuerde que las respuestas de Likert son estimaciones: no está utilizando una regla perfectamente confiable para medir un objeto físico con dimensiones estables. La media es una medida poderosa cuando se usan tamaños de muestra razonables.
En negocios e investigación y desarrollo de productos, la media es, con mucho, la estadística más común utilizada con escalas Likert. Cuando uso escalas Likert, generalmente he elegido una medida que se adapta idealmente a la pregunta de investigación. Por ejemplo, si está hablando de "preferencia" o "actitudes", puede usar múltiples indicadores basados en Likert, y cada indicador proporciona una perspectiva ligeramente diferente.
fuente
Los "puntajes de caja" a menudo se usan para resumir datos ordinales, particularmente cuando se trata de anclajes verbales significativos. En otras palabras, puede informar "cuadro superior 2", el porcentaje que eligió ya sea "de acuerdo" o "totalmente de acuerdo".
fuente