Valores críticos de Wilcoxon-Mann-Whitney en R

10

He notado que cuando trato de encontrar los valores críticos para el U de Mann-Whitney usando R, los valores son siempre 1 + valor crítico. Por ejemplo, para , el valor crítico (dos colas) es 8, mientras que para , el (dos colas) ) el valor crítico es 22 (verifique las tablas ), pero:α = .05 , n = 12 , m = 8α=.05,n=10,m=5α=.05,n=12,m=8

> qwilcox(.05/2,10,5)
[1] 9
> qwilcox(.05/2,12,8)
[1] 23

Por supuesto que no estoy considerando algo, pero ... ¿alguien podría explicarme por qué?

esto.no.no.nick
fuente

Respuestas:

17

Creo que la respuesta aquí podría ser que estás comparando manzanas y naranjas.

Deje denotar el cdf de la estadística Mann-Whitney . es la función cuantil de . Por definición, es U Q ( α ) U Q ( α ) = inf { x N : F ( x ) α } ,F(x)UqwilcoxQ(α)U

Q(α)=inf{xN:F(x)α},α(0,1).

Debido a que es discreto, generalmente no hay tal que , por lo que generalmente .x F ( x ) = α F ( Q ( α ) ) > αUxF(x)=αF(Q(α))>α

Ahora, considere el valor crítico para la prueba. En este caso, desea , ya que de lo contrario tendrá una prueba con una tasa de error de tipo I que es mayor que la nominal. Esto generalmente se considera indeseable; Se prefieren las pruebas conservadoras . Por lo tanto, A menos que haya una tal que , por lo tanto, tenemos .F ( C ( α ) ) α C ( α ) = sup { x N : F ( x ) α } ,C(α)F(C(α))αx F ( x ) = α C ( α ) = Q ( α ) - 1

C(α)=sup{xN:F(x)α},α(0,1).
xF(x)=αC(α)=Q(α)1

¡La razón de la discrepancia es que qwilcoxse ha diseñado para calcular cuantiles y no valores críticos!

MånsT
fuente
1
(+1) Descripción buena, simple y concisa. :)
cardenal
2

Recuerde que el estadístico de prueba de suma de rango es discreto y, por lo tanto, debe usar un valor crítico tal que la probabilidad de cola sea a la especificada . Para algunos tamaños de muestra iguales a alfa no se puede lograr y esa es mi suposición de por qué necesita el +1.αα

Michael R. Chernick
fuente
44
Entonces, ¿por qué se necesita +1 en R y no en las tablas habituales?
MånsT
1
@ this.is.not.a.nick: quizás lo más importante, mientras que , lo que significa que en el primer caso el nivel de significancia real será y que en el último será0.02868937 > 0.025 < 0.050.0236723<0.0250.02868937>0.025<0.05>0.05
1
Derecho tanto a Procrastinator como a MansT. En realidad, la definición del nivel de significancia requiere que las probabilidades de cola no sumen nada más alto que alfa. Hablo de esto en mi artículo con Christine Liu sobre el comportamiento dentado de la función de potencia para pruebas binomiales exactas a través del método Clopper-Pearson (ver American Statistician (2002)).
Michael R. Chernick
2
@Michael: Está en la misma página que esta. Las tablas siguen la definición estándar, lo que significa que los valores críticos no son cuantiles.
Lunes
3
@Michael: De acuerdo. En cierto sentido, qwilcoxhace lo que se supone que debe hacer, pero no lo que espera que haga.
Lunes