He visto en la literatura publicada (y publicada aquí) que la eficiencia relativa asintótica de la prueba de rango con signo de Wilcoxon es de al menos 0,864 en comparación con la prueba t. También he oído que esto solo se aplica a muestras grandes, aunque algunos libros no mencionan esto (¿qué pasa con eso?).
De todos modos, mi pregunta es, ¿qué tan pequeñas deben ser las cosas antes de que el párrafo anterior ya no se aplique?
En mi caso tengo 4 pares de datos. Si se cumplen todos los supuestos, sé que tengo al menos un 90% de potencia para detectar un tamaño de efecto de 2SD bajo la prueba t emparejada si uso un alfa de 0.1 y tengo datos moderadamente correlacionados. Sin embargo, me gustaría usar la prueba de rango con signo de Wilcoxon debido al pequeño tamaño de la muestra y la imposibilidad de verificar las suposiciones, pero me preocupa que la prueba tenga muy poca potencia si lo hago. ¡Gracias!
Respuestas:
Klotz observó una pequeña potencia de muestra de la prueba de rango con signo en comparación con la muestra en el caso normal.t
[Klotz, J. (1963) "Muestra pequeña de potencia y eficiencia para las pruebas de Wilcoxon y puntajes normales de una muestra" The Annals of Mathematical Statistics , vol. 34, núm. 2, págs. 624-632]
En y cerca de (los s exactos no son alcanzables, por supuesto, a menos que siga la ruta de aleatorización, que la mayoría de las personas evita en uso, y creo que con razón) la eficiencia relativa de la en la normalidad tiende a estar bastante cerca del ARE allí (0.955), aunque cuán cerca depende (varía con el desplazamiento medio y en más pequeño , la eficiencia será menor). Con tamaños de muestra más pequeños que 10, la eficiencia es generalmente (un poco) mayor.n=10 α 0.1 α t α
En y (ambos con cerca de 0,05), la eficiencia fue de alrededor de 0,97 o superior.n=5 n=6 α
Entonces, en términos generales ... el ARE en la normalidad es una subestimación de la eficiencia relativa en el caso de muestra pequeña, siempre que no sea pequeño. Creo que para una prueba de dos colas con su más pequeño alcanzable es 0.125. En ese nivel de significancia y tamaño de muestra exactos, creo que la eficiencia relativa de la será similarmente alta (quizás aún alrededor de 0.97-0.98 o más) en el área donde el poder es interesante.α n=4 α t
Probablemente debería volver y hablar sobre cómo hacer una simulación, lo cual es relativamente sencillo.
Editar:
Acabo de hacer una simulación en el nivel 0.125 (porque es alcanzable en este tamaño de muestra); parece que, en un rango de diferencias en la media, la eficiencia típica es un poco menor, para , más alrededor de 0.95-0.97 más o menos, similar al valor asintótico.n=4
Actualizar
Aquí hay una gráfica de la potencia (2 lados) para la prueba t (calculada por
power.t.test
) en muestras normales, y la potencia simulada para la prueba de rango con signo de Wilcoxon: 40000 simulaciones por punto, con la prueba t como una variante de control. La incertidumbre en la posición de los puntos es inferior a un píxel:Para que esta respuesta sea más completa, debería analizar el comportamiento para el caso en el que ARE es en realidad 0.864 (la beta (2,2)).
fuente