Prueba de suma de rango de Wilcoxon en R

13

Tengo resultados de la misma prueba aplicada a dos muestras independientes:

x <- c(17, 12, 13, 16, 9, 19, 21, 12, 18, 17)
y <- c(10, 6, 15, 9, 8, 11, 8, 16, 13, 7, 5, 14)

Y quiero calcular una prueba de suma de rango de Wilcoxon.

Cuando calculo la estadística a mano, obtengo: TW

TW=rango(Xyo)=156,5

Cuando dejo que R realice un a wilcox.test(x, y, correct = F), obtengo:

W = 101.5

¿Porqué es eso? ¿No debería devolverse la estadística solo cuando realizo una prueba de rango con signo ? ¿O no entiendo la prueba de suma de rango?W+paired = T

¿Cómo puedo decirle a R queTW


Como parte de los resultados de la prueba, no a través de algo como:

dat <- data.frame(v = c(x, y), s = factor(rep(c("x", "y"), c(10, 12))))
dat$r <- rank(dat$v)
T.W <- sum(dat$r[dat$s == "x"])

Hice una pregunta de seguimiento sobre el significado de las diferentes formas de calcular el estadístico de prueba para la prueba de suma de rango de Wilcoxon

Comunidad
fuente

Respuestas:

15

La Noteayuda de la wilcox.testfunción explica claramente por qué el valor de R es menor que el tuyo:

Nota

La literatura no es unánime sobre las definiciones de la suma de rango de Wilcoxon y las pruebas de Mann-Whitney. Las dos definiciones más comunes corresponden a la suma de los rangos de la primera muestra con el valor mínimo restado o no: R resta y S-PLUS no, dando un valor que es mayor en m (m + 1) / 2 para un primera muestra de talla m. (Parece que el artículo original de Wilcoxon usó la suma no ajustada de los rangos, pero las tablas substrajeron el mínimo).

norte1(norte1+1)/ /2norte1

En cuanto a modificar el resultado, puede asignar la salida desde wilcox.testuna variable, digamos a, y luego manipular a$statistic, agregando el mínimo a su valor y cambiando su nombre. Luego, cuando imprima a(por ejemplo, escribiendo a), se verá de la manera que desee.

Para ver a qué me refiero, intente esto:

a <- wilcox.test(x,y,correct=FALSE)
str(a) 

Entonces, por ejemplo, si haces esto:

n1 <- length(x)
a$statistic <- a$statistic + n1*(n1+1)/2
names(a$statistic) <- "T.W"
a

entonces obtienes:

        Wilcoxon rank sum test with continuity correction

data:  x and y 
T.W = 156.5, p-value = 0.006768
alternative hypothesis: true location shift is not equal to 0 

norte1(norte1+1)/ /2WwUW

Glen_b -Reinstate a Monica
fuente