¿La salida de estadística W de wilcox.test () en R es la misma que la estadística U?

22

Recientemente he estado leyendo sobre la prueba U de Mann-Whitney. Resulta que para llevar a cabo esta prueba en R, ¡realmente necesitas ejecutar una prueba de Wilcoxon!

Mi pregunta: ¿es la estadística W de wilcox.testR idéntica a la estadística U?

luciano
fuente

Respuestas:

25

A Wilcoxon generalmente se le atribuye ser el inventor original de la prueba *, aunque el enfoque de Mann y Whitney fue un gran avance, y ampliaron los casos para los que se tabuló la estadística. Prefiero referirme a la prueba como Wilcoxon-Mann-Whitney, para reconocer ambas contribuciones (también se ve a Mann-Whitney-Wilcoxon; tampoco me importa).

* Sin embargo, la imagen real es un poco más turbia, con varios otros autores que también presentan estadísticas iguales o similares sobre este momento o antes, o en algunos casos hacen contribuciones que están estrechamente relacionadas con la prueba. Al menos parte del crédito debería ir a otro lado.

La prueba de Wilcoxon y la prueba U de Mann-Whitney son equivalentes (y la ayuda indica que lo son) en el sentido de que siempre rechazan los mismos casos en las mismas circunstancias; a lo sumo, sus estadísticas de prueba solo diferirán por un cambio (y en algunos casos, posiblemente un cambio de signo).

La prueba de Wilcoxon se define en más de una forma en la literatura (y esa ambigüedad se remonta a la tabulación original de la estadística de la prueba, más que en un momento), por lo que hay que tener cuidado con la prueba de Wilcoxon que se está discutiendo.

Las dos formas más comunes de definición se discuten en este par de publicaciones:

Prueba de suma de rango de Wilcoxon en R

Diferentes formas de calcular el estadístico de prueba para la prueba de suma de rango de Wilcoxon

Para abordar lo que, específicamente, sucede en R:

La estadística utilizada por wilcox.testen R se define en la ayuda ( ?wilcox.test), y la cuestión de la relación con la estadística U de Mann-Whitney se explica allí:

La literatura no es unánime sobre las definiciones de la suma de rango de Wilcoxon y las pruebas de Mann-Whitney

Las dos definiciones más comunes corresponden a la suma de los rangos de la primera muestra con el valor mínimo sustraído o no: R resta y S-PLUS no, dando un valor que es mayor en m (m + 1) / 2 para un primera muestra de talla m. (Parece que el documento original de Wilcoxon usó la suma no ajustada de los rangos, pero las tablas subsiguientes restaron el mínimo).

El valor de R también se puede calcular como el número de todos los pares (x[i], y[j])para los cuales y[j]no es mayor que x[i], la definición más común de la prueba de Mann-Whitney.

Esta última oración responde completamente ese aspecto de su pregunta: la versión de W que R saca * también es el valor de U.

norte1(norte1+1)2

Glen_b -Reinstate a Monica
fuente
7

Tanto la prueba de suma de rango de Wilcoxon como la prueba de Mann-Whitney son los equivalentes no paramétricos de la prueba t independiente . En algunos casos, la versión de W que R da, también es el valor de U. Pero no en todos los casos.

Cuando usa: wilcox.test(df$var1 ~ df$var2, paired=FALSE)la W dada es la misma que U. Por lo tanto, puede informarla como la estadística U de Mann-Whitney.

Sin embargo, cuando usa:, en wilcox.test(df$var1 ~ df$var2, paired=TRUE)realidad está realizando una prueba de rango con signo de Wilcoxon. La prueba de rango con signo de Wilcoxon es el equivalente de la prueba t dependiente .

Fuente: "Estadísticas de descubrimiento utilizando R" por Andy Field (2013)

Jaap
fuente
1
Una buena idea es señalar que si usas el argumento paired=TRUEno es el Wilcoxon-Mann-Whitney sino el rango firmado.
Glen_b -Reinstate Monica
1

Sin embargo, tenga en cuenta que el código: wilcox.test(df$var1 ~ df$var2, paired=FALSE)(usando '~')

producirá una estadística W diferente que a: wilcox.test(df$var1, df$var2, paired=FALSE)(usando ',')

Tilen
fuente
Bienvenido al sitio, @Tilen. ¿Fue esto una respuesta a la pregunta del OP, un comentario solicitando una aclaración del OP o uno de los que respondieron, o una nueva pregunta propia? Utilice solo el campo "Su respuesta" para proporcionar respuestas a la pregunta original. Podrás comentar en cualquier lugar cuando tu reputación sea> 50. Si tiene una nueva pregunta, haga clic en el gris ASK QUESTION en la parte superior de la página y pregunte allí, entonces podemos ayudarlo adecuadamente. Como eres nuevo aquí, es posible que quieras hacer nuestro recorrido , que tiene información para nuevos usuarios.
gung - Restablece a Monica
Muchas gracias @gung. De hecho, fue una especie de respuesta y pregunta, supongo. Gracias por los consejos. Espero ser parte de esto.
Tilen
Las 'respuestas' son solo para respuestas directas a la pregunta. ¿Puedes editar esto para hacerlo más puramente una respuesta?
gung - Restablece a Monica
Lo siento por eso. Lo edité ahora. ¿Se ve mejor ahora?
Tilen
1
No necesitas disculparte. Creo que tu respuesta está implícita en lo que has puesto aquí, pero la gente tendrá que leer entre líneas. ¿Puedes hacerlo explícito y atarlo todo en un arco? Sin embargo, no estoy seguro de que esto sea correcto. Para usar la versión de la fórmula, necesita un vector de valores y un indicador de agrupación. Ej wilcox.test(values~ind, with(df, stack(var1=var1, var2=var2)), paired=FALSE). Cuando hago eso, obtengo lo mismo en Wambos sentidos.
gung - Restablecer Monica