¿Cómo se informa una prueba de Mann-Whitney?

10

Estoy haciendo mi disertación y estoy llevando a cabo una serie de pruebas. Después de usar una prueba de Kruskal-Wallis, generalmente informo el resultado de esta manera:

Hay una diferencia significativa entre las medias de ...(χ(2)2=7.448,p=.024)

Pero ahora realicé una prueba de Mann-Whitney y no estoy seguro de qué valores presentar. SPSS me da un Mann-Whitney , Wilcoxon , y -valor. ¿Presento todos estos 4 valores? ¿O son algunos irrelevantes?W Z PUWZP

disertación
fuente

Respuestas:

12

Wikipedia parece tener tus respuestas. Aquí hay un extracto de la declaración de resultados de ejemplo:

Al informar los resultados de una prueba de Mann-Whitney, es importante indicar:

  • Una medida de las tendencias centrales de los dos grupos (medias o medianas; dado que Mann-Whitney es una prueba ordinal, generalmente se recomiendan medianas)
  • El valor de U
  • Los tamaños de muestra
  • El nivel de significancia.

En la práctica, es posible que parte de esta información ya se haya suministrado y se debe usar el sentido común para decidir si se debe repetir. Un informe típico podría ejecutarse,

"Las latencias medias en los grupos E y C fueron 153 y 247 ms; las distribuciones en los dos grupos diferían significativamente (Mann – Whitney U = 10.5, n 1 = n 2 = 8, P <0.05 dos colas)".

La prueba de rango con signo de Wilcoxon es apropiada para muestras emparejadas, mientras que la prueba de Mann-Whitney asume muestras independientes. Sin embargo, de acuerdo con Field (2000) , el Wilcoxon en su salida de SPSS es "una versión diferente de esta estadística, que se puede convertir en una puntuación Z y, por lo tanto, se puede comparar con los valores críticos de la distribución normal". ¡Eso explica tu puntaje también!zWz

Para su información, Wikipedia agrega que, para muestras grandes, está aproximadamente distribuido normalmente. Teniendo en cuenta todos estos valores, también se puede calcular el tamaño del efecto , que en el caso del ejemplo de Wikipedia es 0,319 (una calculadora se implementa en la sección 11 aquí ). Sin embargo, esta transformación del estadístico de prueba depende de la normalidad aproximada de , por lo que puede ser inexacta con n s = 8 ( Fritz et al., 2012 ) .U Uη2U

PD Los resultados de la prueba de Kruskal – Wallis no deben interpretarse como reveladoras diferencias entre medias, excepto en circunstancias especiales. Consulte la respuesta de @ Glen_b a otra pregunta, "Diferencia entre ANOVA y prueba de Kruskal-Wallis" para más detalles.

Referencias

Field, A. (2000). 3.1. Prueba de Mann-Whitney. Métodos de investigación 1: SPSS para Windows, parte 3: Pruebas no paramétricas. Recuperado de http://www.statisticshell.com/docs/nonparametric.pdf .
Fritz, CO, Morris, PE y Richler, JJ (2012). Estimaciones del tamaño del efecto: uso actual, cálculos e interpretación. Revista de psicología experimental: general , 141 (1), 2-18. PDF disponible a través de ResearchGate .

Nick Stauner
fuente
3
¿Cuál es el punto de informar el valor de U en el ejemplo anterior? ¿Qué gano yo, como lector, al saber que U era 10.5?
ameba
44
En el ejemplo anterior, obtienes la capacidad de calcular la exacta , que no se proporciona y puede ser útil para la estimación del tamaño del efecto, el metanálisis o la comprobación de hacking. Un amigo y colega mío @rpierce también me ha aconsejado que informe sobre las estadísticas de prueba para asegurar a los lectores que estoy haciendo las cosas correctamente en general, ya que ha captado muchos artículos publicados que lo hacen mal a través de estadísticas de prueba mal informadas y asociado . p d fppdf
Nick Stauner
Interesante. Supongo que este tema podría merecer una pregunta por separado, que podría preguntar aquí en algún momento. Aún así: si uno quiere valores p exactos, ¡entonces puede informar valores p exactos! De hecho, el consejo habitual es informar los valores p exactos, a menos que sean muy pequeños, como p <0,0001; pero en este caso el hackeo p es poco probable. Y el tamaño del efecto debe informarse por separado de todos modos, por ejemplo, "las latencias medias en los grupos E y C fueron 153 y 247 ms" en su cita de wiki.
ameba
1
Grupo secreto de Facebook (es decir, que no se puede buscar) para los graduados psicológicos de nuestra alma mater; No hay ejemplos incluidos. Aunque también tengo curiosidad. Tal vez puedas lograr que comparta algunos si lo etiquetas en una pregunta separada :) Apuesto a que otros aquí también tendrían muchos ejemplos para intervenir, es decir, si la pregunta no se cierra como algo fuera de tema ! Ciertamente, una pregunta más básica como, "¿Por qué es importante informar las estadísticas de prueba además de y el tamaño del efecto?" sin embargo, estaría en el tema, creo ... Verifique primero si hay duplicados debajo de la etiqueta de informe , si realmente quiere estar seguro ...p
Nick Stauner
1
Cuando los tamaños de muestra no sean tan pequeños que se malinterpreten, me inclinaría por informar un U o W estandarizado (estandarizado, son idénticos) como un valor Z ( , por ejemplo), porque los lectores tendrán un sentido intuitivo de lo que eso significa, aunque entonces es necesario ser claro cuando tiene el valor p exacto, si lo tiene, no uno basado en el puntaje Z para la estadística. ZU
Glen_b -Reinstale a Monica