Análisis de potencia para Kruskal-Wallis o prueba U de Mann-Whitney usando R?

Respuestas:

3

Ciertamente es posible calcular la potencia.

Para ser más específicos: si hace suposiciones suficientes para obtener una situación en la que puede calcular (de alguna manera) la probabilidad de rechazo, puede calcular la potencia.

En Wilcoxon-Mann-Whitney, si (por ejemplo) asume las formas de distribución (haga una suposición sobre la (s) forma (s) de distribución) y asuma algo sobre las escalas (spreads) y los valores específicos de las ubicaciones o la diferencia en ubicaciones , es posible que pueda calcular el poder algebraicamente o mediante integración numérica; si no puede simular la tasa de rechazo.

Entonces, por ejemplo, si suponemos un muestreo de distribuciones con una diferencia de ubicación especificada (estandarizado para una escala común), entonces, dados los tamaños de muestra, podríamos simular muchos conjuntos de datos que satisfagan todas esas condiciones y así obtener una estimación de la tasa de rechazo. Así que supongamos que tenemos dos muestras de t 5t5t5 distribuciones (familia de escala de ubicación) con escala unitaria ( ), sin pérdida de generalidad, y con diferencia de ubicación δ = μ 2 - μ 1 = 1 . Nuevamente, sin pérdida de generalidad podríamos tomar μ 1 = 0σ=1δ=μ2μ1=1μ1=0. Luego, para un tamaño de muestra específico, (digamos), podemos simular las observaciones y, por lo tanto, la potencia para ese valor particular de δ / σ (es decir, 1 ). Aquí hay un ejemplo rápido en R:n1=6,n2=9δ/σ1

n1=6;n2=9;tdf=5;delta=1;al=0.05;nsim=10000
res = replicate(nsim,{y1=rt(n1,tdf);y2=rt(n2,tdf)+delta;wilcox.test(y1,y2)$p.value<=al})
mean(res)  # res will be logical ("TRUE" = reject); mean is rej rate

Tres simulaciones como esa produjeron tasas de rechazo de 0.321, 0.321 y 0.316; el poder aparentemente está en la vecindad de 0.32 (puede calcular un intervalo de confianza a partir de una sola de esas simulaciones, ya que el recuento de rechazos es binomial ). En la práctica, tiendo a usar simulaciones más grandes, pero si estás simulando muchos 's o δ diferentes , es posible que no desees subir mucho más de 10000 simulaciones para cada uno.nδ

Al hacerlo para muchos valores del cambio de ubicación, incluso puede obtener una curva de potencia para ese conjunto de circunstancias a medida que el cambio de ubicación cambia si lo desea.

n1n2σ2δ/σδnn1biδ=δiΦ1(1b)δδδnδ

P(Y2>Y1)

Tenga en cuenta que si bien estas pruebas no tienen distribución (para distribuciones continuas) bajo nulo, el comportamiento es diferente bajo diferentes supuestos de distribución para las alternativas.

La situación para Kruskal-Wallis es similar, pero tiene más cambios de ubicación (o cualquier otra situación que esté mirando) para especificar.

La gráfica en esta respuesta muestra una comparación de una curva de potencia para una prueba t pareada con una potencia simulada para una prueba de rango con signo en un tamaño de muestra particular, a través de una variedad de cambios de ubicación estandarizados para el muestreo de distribuciones normales con una correlación específica entre pares. Se pueden hacer cálculos similares para Mann-Whitney y Kruskal-Wallis.

Glen_b -Reinstate a Monica
fuente