¿Cómo probar las diferencias entre las medianas de múltiples elementos Likert?

8

En un estudio de cuestionario, les pedimos a los encuestados que expresaran sus actitudes sobre cómo los diferentes factores climáticos invernales, como la nieve y la resbaladiza, podrían afectar su elección de caminar y andar en bicicleta al trabajo. La muestra compuesta por 500 individuos y las respuestas estaban en forma de 5 escalas de calificación muy negativa a muy positiva (escala ordinal).

Si quiero comparar las respuestas a diferentes preguntas, supongo que la mediana es una herramienta adecuada ya que los datos son ordinales. Sé que comparar significa que hay diferentes pruebas estadísticas para mostrar si la probabilidad de diferencia es significativa (prueba t o prueba no paramétrica ...). Pero estoy un poco confundido si puedo usar estas pruebas en el tipo de datos que expliqué aquí.

  • ¿Hay alguna estadística de prueba para comparar medianas?
  • ¿O debería transferir datos a escala de intervalo si es apropiado?
Saeed
fuente

Respuestas:

4

Considero que la media es un indicador mucho más útil de la tendencia central de los ítems Likert que la mediana. He elaborado mi argumento aquí sobre una pregunta sobre si se debe usar la media o la mediana para los elementos similares .

Un resumen de algunas de estas razones:

  • La media es más informativa; la mediana es demasiado asquerosa para los artículos Likert. Por ejemplo, la mediana de 1 1 3 3 3es igual a 3 3 3 5 5(es decir, 3) pero la media refleja la diferencia.
  • Los elementos de Likert a menudo se expresan de manera tal que la suposición de igual distancia entre categorías es un punto de partida útil.
  • Incluso si las respuestas individuales son discretas, la medición del nivel de grupo se aproxima a la continuidad (con 500 personas y una escala de 5 puntos, el valor de su media podría tomar 500 * 4 + 1 = 2001diferentes valores)
  • Hay pocos argumentos de que un porcentaje sea un resumen útil en las preguntas de tipo sí-no (por ejemplo, votación). Esta es solo la media donde se han codificado las respuestas 0 and 1. Tratar una escala likert de 5 puntos como me 1 2 3 4 5parece casi tan natural.
  • Es probable que otras escalas plausibles de los elementos de Likert no cambien las inferencias de manera sustancial con respecto a si existen diferencias entre las medias (pero puede verificar esto).

Si está convencido de que la media es la medida apropiada de la tendencia central, entonces desearía estructurar sus pruebas de hipótesis para que comprueben las diferencias entre medias. Una prueba t de muestra pareada permitiría una comparación de medias por pares, pero habría problemas en torno a la precisión de los valores p dada la distribución de error discreta y no normal. Sin embargo, adoptar un enfoque no paramétrico no es una solución, porque cambia la hipótesis.

Esperaría que la prueba t de muestra pareada fuera bastante robusta, al menos para el elemento típicamente Likert, lo que significa que evitaría cualquier extremo en la escala, pero no tengo ningún estudio de simulación disponible.

Jeromy Anglim
fuente
2

En general, estoy de acuerdo con los argumentos de Jeromy de que la media es una estadística razonable para las escalas Likert. Lo que podría hablar para la mediana, es que la mediana es una medida de ubicación mucho más robusta ya que protege contra los valores atípicos (tiene el punto de descomposición más alto posible del 50%). Sin embargo, como las escalas Likert son escalas acotadas, la posibilidad de valores extremos extremos es muy baja (solo si sus datos están extremadamente sesgados). Además, la mediana generalmente recorta demasiado de los datos, por lo que podría considerar el uso de medios recortados. Por lo general, se recomienda una cantidad de recorte del 20% [1].

Si desea calcular una prueba pareada de la diferencia de medianas, recomendaría comparar las medias utilizando un método de arranque por percentil (este es el único método para comparar medianas que funciona bien en el caso de valores vinculados, ver Wilcox, 2005 [ 1]).

En el paquete WRS para R, hay una función llamada trimpb2que realiza este cálculo para dos muestras independientes (también puede calcular el valor p para los medios de ajuste con esa función). En su caso, sin embargo, necesita comparar grupos dependientes. En este caso, también puede hacer un método de arranque de percentil ajustado por sesgo [2].

Sin embargo, tenga en cuenta que la diferencia de las medianas de las distribuciones marginales no es lo mismo que observar la mediana de los puntajes de diferencia. El primero responde a la pregunta '¿En qué se diferencia la respuesta típica del primer grupo del segundo' y la función WRS la realiza rmmcppb? El segundo responde a la pregunta "¿Cuál es la puntuación de diferencia típica" y la realiza la función WRS rmmcppbd.

[1] Wilcox, RR (2005). Introducción a la estimación robusta y la prueba de hipótesis. San Diego: Academic Press.

[2] Wilcox, RR (2006). Comparaciones por pares de grupos dependientes basados ​​en medianas. Estadística computacional y análisis de datos, 50, 2933-2941. doi: 10.1016 / j.csda.2005.04.017

Felix S
fuente
0

Una opción para comparar medianas son las pruebas de permutación . Sin embargo, si está comparando las respuestas 2 preguntas que fueron completadas por el mismo conjunto de personas (datos emparejados), entonces también es posible que desee ver el examen de McNemar y las variaciones en él.

Para resumir un poco, la idea de la prueba de McNemar (y sus extensiones) es mirar una matriz con los recuentos de cuántos encuestados eligieron las combinaciones, por lo que un individuo contribuiría al recuento en la celda cuya columna está determinada por su respuesta a la pregunta 1 y la fila están determinadas por su respuesta a la pregunta 2 (los comandos de tabla o tabla cruzada crean la matriz). El patrón en esta matriz probablemente será más informativo que una simple media o mediana. La diagonal representa a las personas que respondieron lo mismo a las 2 preguntas, el triángulo superior son los que respondieron más alto en la primera pregunta que en la segunda pregunta, y el triángulo inferior la diferencia. La distancia desde la diagonal indica cuán diferentes fueron las 2 respuestas. Las variaciones en la prueba de McNemar observan si los recuentos en los 2 triángulos son diferentes, o si la matriz es simétrica. Para tener en cuenta la naturaleza ordinal (vs. nominal) de los datos, se tiene en cuenta la distancia desde la diagonal.

Solo mirar los patrones en la tabla puede ser suficiente para sus propósitos, pero si necesita una prueba formal, puede ir con las pruebas sugeridas o hacer algún tipo de prueba de permutación (exactamente cómo depende de lo que esté buscando) o tratando de mostrar).

Greg Snow
fuente
3
La prueba de McNemar es para datos nominales. Para los datos ordinales, como aquí, las personas suelen elegir la prueba de rango con signo de Wilcoxon o la prueba de signo (pero el poder de esta última tiende a ser bajo).
whuber
El problema con la pregunta de Saeed es que requieren la comparación de medianas de distribuciones relacionadas , no independientes. La prueba t de muestras pareadas, podemos decirlo, compara medias , porque su numerador, la media de las diferencias por caso, es el mismo valor que la diferencia entre las dos medias. Pero para la mediana, la mediana de las diferencias por caso no es el mismo valor que la diferencia entre las dos medianas. Por lo tanto, dudo que exista una prueba que podría llamarse exactamente "prueba de medianas para muestras emparejadas".
ttnphns