Hipótesis nula de Mann-Whitney bajo varianza desigual

Tengo curiosidad por la hipótesis nula de una prueba U de Mann-Whitney. A menudo veo que se afirma que la hipótesis nula es que dos poblaciones tienen distribuciones iguales. Pero estoy pensando: si tuviera dos poblaciones normales con la misma varianza media pero extremadamente desigual, la prueba de Mann-Whitney probablemente no detectaría esta diferencia.

También he visto que la hipótesis nula de la prueba de Mann-Whitney es o la probabilidad de que una observación de una población ( ) exceda una observación de la segunda población ( ) (después de la exclusión de lazos) es igual a 0.5. Esto parece tener un poco más de sentido, pero no parece equivalente a la primera hipótesis nula que expuse. $\Pr(X>Y)=0.5$ $X$ $Y$

Espero obtener un poco de ayuda para desenredar esto. ¡Gracias!

hypothesis-testing variance wilcoxon-mann-whitney Jimj
fuente

Respuestas:

La prueba de Mann-Whitney es un caso especial de una prueba de permutación (la distribución bajo el nulo se obtiene al observar todas las permutaciones posibles de los datos) y las pruebas de permutación tienen el nulo como distribuciones idénticas, por lo que es técnicamente correcto.

Una forma de pensar en la estadística de prueba de Mann-Whitney es una medida del número de veces que un valor elegido aleatoriamente de un grupo excede un valor elegido aleatoriamente del otro grupo. Por lo tanto, P (X> Y) = 0.5 también tiene sentido y esto es técnicamente una propiedad de las distribuciones iguales nulas (suponiendo distribuciones continuas donde la probabilidad de un empate es 0). Si las 2 distribuciones son iguales, entonces la probabilidad de que X sea mayor que Y es 0.5 ya que ambas se extraen de la misma distribución.

El caso declarado de 2 distribuciones que tienen la misma media pero varianzas muy diferentes coincide con la segunda hipótesis nula, pero no con la primera de distribuciones idénticas. Podemos hacer una simulación para ver qué sucede con los valores p en este caso (en teoría, deberían estar distribuidos uniformemente):

> out <- replicate( 100000, wilcox.test( rnorm(25, 0, 2), rnorm(25,0,10) )$p.value )
> hist(out)
> mean(out < 0.05)
[1] 0.07991
> prop.test( sum(out<0.05), length(out), p=0.05 )

        1-sample proportions test with continuity correction

data:  sum(out < 0.05) out of length(out), null probability 0.05
X-squared = 1882.756, df = 1, p-value < 2.2e-16
alternative hypothesis: true p is not equal to 0.05
95 percent confidence interval:
 0.07824054 0.08161183
sample estimates:
      p 
0.07991

Claramente, esto se rechaza con más frecuencia de lo que debería y la hipótesis nula es falsa (esto coincide con la igualdad de distribuciones, pero no con prob = 0.5).

Pensar en términos de probabilidad de X> Y también tiene algunos problemas interesantes si alguna vez compara poblaciones basadas en los dados de Efron .

Greg Snow
fuente

Hola Greg, gracias por la respuesta. Parece que lo que está diciendo es que encontré un caso especial en el que la prueba no funciona correctamente con distribuciones iguales nulas. Y además, las hipótesis nulas que expuse no son iguales. ¿Es eso correcto?

Jimj

Mann-Whitney no es sensible a los cambios en la varianza con igual media, pero puede, como puede ver con la forma , detectar diferencias que llevan a a desviarse de (p. Ej. donde tanto la media como la varianza aumentan juntas). Es evidente que si tuvieras dos normales con igual media, sus diferencias son simétricas con respecto a cero. Por lo tanto $P(X>Y)=0.5$ $P(X>Y)$ $0.5$ , que es la situación nula. $P(X>Y) = P(X-Y>0) = \frac{1}{2}$

$Y$ $1$ $X$ $k$

Si le interesan las pruebas que son conceptualmente muy similares a las de Mann-Whitney y que son sensibles a las diferencias en la propagación bajo la igualdad de las medianas, existen varias de estas pruebas.

Existe la prueba de Siegel-Tukey y la prueba de Ansari-Bradley, por ejemplo, ambas estrechamente relacionadas con la prueba de dos muestras de Mann-Whitney-Wilcoxon.

Ambos se basan en la idea básica de clasificar desde los extremos.

Si usa R, la prueba Ansari-Bradley está integrada ... ?ansari.test

En efecto, el Siegel-Tukey solo hace una prueba de Mann-Whitney-Wilcoxon en rangos calculados de la muestra de manera diferente; si clasifica los datos usted mismo, realmente no necesita una función separada para los valores p. Sin embargo, puedes encontrar algunos, como aquí:

http://www.r-statistics.com/2010/02/siegel-tukey-a-non-parametric-test-for-equality-in-variability-r-code/

(en relación con el comentario de ttnphns bajo mi respuesta original)

Estaría sobre interpretando mi respuesta al leerlo como en desacuerdo con @GregSnow en un sentido particularmente sustantivo. Ciertamente, hay una diferencia en el énfasis y, hasta cierto punto, en lo que estamos hablando, pero me sorprendería mucho si hubiera un desacuerdo real detrás de esto.

$U$ $x$ $y$ $f=g$

$U$ $y$ $x$ $\frac{1}{2}$ $Y$ $X$

$U$ $X$ $Y$ $f=g$

$f=g$

Creo que en muchas situaciones lo hace; en particular para situaciones que incluyen pero más generales que la que usted describe (dos poblaciones normales con la misma varianza media pero extremadamente desigual pueden generalizarse bastante sin alterar la distribución resultante basada en los rangos), creo que la distribución del estadístico de prueba Resulta que tiene la misma distribución bajo la cual se derivó y, por lo tanto, debería ser válido allí. Hice algunas simulaciones que parecen apoyar esto. Sin embargo, no siempre será una prueba muy útil (puede tener poca potencia).

$f=g$

Haz lo que quieras, pero no interpreto esto como un desacuerdo sustancial con @GregSnow

Referencia: artículo original de Mann & Whitney

Glen_b -Reinstate a Monica
fuente

He llegado hasta que la derecha que están de acuerdo con estas palabras de la página de discusión de Mann-Whitney de Wikipedia:

the null hypothesis of Mann-Whitney U-test is not about the equality of distributions. Is is about the symmetry between two populations with respect to the probability of obtaining a larger observation

. Y entonces no estás de acuerdo con la respuesta de @ Greg, ¿verdad?

ttnphns

He agregado alguna discusión en edición.

Glen_b -Reinstate Monica el

Muy buena adición. Lo estudiaré (siempre sentí como si hubiera matices en la prueba de MW que continúan eludiéndome). Mientras tanto, estará de acuerdo si yo dijera: "Debido a que la estadística de prueba de MW refleja solo la (in) igualdad de los rangos medios , puede haber situaciones en las que f ~ = g [Entiendo f, g como distribuciones originales, clasificación previa] pero sin embargo, la prueba es completamente relevante ya que continúa tratando con el mismo H0 que bajo f = g. Un ejemplo de tal situación son las distribuciones simétricas completamente idénticas, excepto el parámetro de dispersión (varianza) ".

ttnphns

f

$f$

g

$g$

X

$X$

Y

$Y$