¿En qué situación sería preferible la prueba de rango firmado de Wilcoxon a la prueba t o la prueba de signos?

10

Después de una discusión (a continuación), ahora tengo una imagen más clara de una pregunta enfocada, por lo que aquí hay una pregunta revisada, aunque algunos de los comentarios ahora pueden parecer ajenos a la pregunta original.

Parece que las pruebas t convergen rápidamente para distribuciones simétricas , que la prueba de rango con signo supone simetría y que, para una distribución simétrica, no hay diferencia entre medias / pseudomedios / medianas. De ser así, ¿en qué circunstancias un estadístico relativamente inexperto consideraría útil la prueba de rango con signo, cuando tiene disponibles tanto la prueba t como la prueba de signos? Si uno de mis alumnos (por ejemplo, ciencias sociales) está tratando de evaluar si un tratamiento funciona mejor que otro (por alguna medida relativamente fácil de interpretar, por ejemplo, alguna noción de diferencia "promedio"), estoy luchando por encontrar un lugar para la firma. prueba de rango, a pesar de que en general parece enseñarse, y la prueba de signos ignorada, en mi universidad.

solo yo
fuente
1
Justme: por supuesto, no pensé en eso.
JonB
1
Depende de que la sabiduría convencional que está viendo; mi experiencia es muy diferente a la tuya. Ciertamente, es fácil encontrar recursos que indiquen claramente que la simetría de los puntajes de diferencia se asume bajo nulo (y que es importante). Pero tenga en cuenta que esto está por debajo de la nula ; como resultado, encontrar la falta de simetría en los puntajes de diferencia en una muestra no es necesariamente relevante; no es necesario tener simetría bajo la alternativa. Si está muy seguro de que si el nulo fuera cierto, la simetría se mantendría, y en muchos casos es una suposición muy plausible ...
ctd
1
ctd ... entonces no hay problema. El problema es que, si no está preparado para asumirlo de antemano, no sabe si el rechazo fue causado por una falla en el supuesto; lo obvio que se debe hacer es simplemente no asumirlo.
Glen_b -Reinstale a Monica el
2
Mirando su segundo comentario primero: (además de lo que ya mencionó), tenga en cuenta que 1. los supuestos normales no agotan las pruebas paramétricas. 2. La prueba de rango con signo no es en realidad una prueba de medianas sino de estadísticas / pseudomedios de Hodges-Lehmann de una muestra (aunque si agrega el supuesto de simetría a la alternativa, también probará medianas, y donde existan medios, también por medios, entre muchas otras cosas). De manera similar, la prueba de suma de rango no es una prueba de medianas sino de diferencias paritarias medias. Tienes razón en que el nivel de la prueba de rango con signo puede ser bastante sensible a la asimetría.
Glen_b -Reinstala a Monica el
2
En su comentario anterior: 1 La simetría generalmente no se ve como parte del nulo, sino como parte de los supuestos que necesita para que las permutaciones sean intercambiables bajo el nulo. 2. como se mencionó anteriormente, en realidad no es una prueba de medianas, sino de pseudomedianos, y esto es válido incluso bajo una alternativa asimétrica. Es cierto que la interpretación a veces es más fácil si hace algunas suposiciones restrictivas, pero las restricciones requeridas para que sea una prueba razonable para las medianas no tienen por qué ser tan estrictas como asumir la simetría bajo la alternativa.
Glen_b -Reinstala a Monica el

Respuestas:

3

Considere una distribución de las diferencias de pares que es un poco más pesada de lo normal, pero no especialmente "pico"; entonces a menudo la prueba de rango con signo tenderá a ser más poderosa que la prueba t, pero también más poderosa que la prueba de signo.

Por ejemplo, en la distribución logística, la eficiencia relativa asintótica de la prueba de rango con signo en relación con la prueba t es 1.097, por lo que la prueba de rango con signo debería ser más potente que la t (al menos en muestras más grandes), pero la eficiencia relativa asintótica de la prueba de signos en relación con la prueba t es 0.822, por lo que la prueba de signos sería menos poderosa que la t (nuevamente, al menos en muestras más grandes).

A medida que avanzamos hacia distribuciones de cola más gruesa (sin dejar de evitar las de pico excesivo), la t tenderá a tener un rendimiento relativamente peor, mientras que la prueba de signos debería mejorar un poco, y tanto el signo como el rango con signo superarán a la t en la detección de pequeños efectos por márgenes sustanciales (es decir, requerirá tamaños de muestra mucho más pequeños para detectar un efecto) Habrá una gran clase de distribuciones para las cuales la prueba de rango firmado es la mejor de las tres.

t3tδ

gráfico de las curvas de potencia para la t, Wilcoxon con signo de rango y pruebas de signos con n = 100 y 5% de nivel de significación para la t3

Como vemos en la gráfica, la prueba de rango con signo tiene más poder que la prueba de signo, que a su vez tiene más poder que la prueba t.

Glen_b -Reinstate a Monica
fuente
¡Muchas gracias por esto @Glen_b! Todavía estoy luchando por averiguar dónde encaja en nuestro programa de estudios, cuando tenemos estudiantes para quienes incluso el concepto de poder está más allá del alcance de sus estudios, y por qué enseñamos a Wilcoxon como la principal alternativa al t emparejado. Pero esto da algunas motivaciones útiles. ¡Gracias!
justme
Incidentalmente, después de considerar qué característica de distribución afecta la varianza asintótica de la mediana (y, por lo tanto, el poder de la prueba de signos), se me ocurrió un ejemplo en el que las posiciones relativas de la prueba de signos y t se invierten; Como resultado, creo que hay una buena posibilidad de construir un caso en el que la prueba de rango firmada sea mucho mejor que cualquiera de las otras dos pruebas. Jugaré un poco más cuando pueda y tal vez escriba algo en él.
Glen_b -Reinstate Monica
En lo que respecta a su plan de estudios, está claro que definitivamente hay casos en los que el rango firmado supera a las otras dos pruebas (como describí en mis respuestas: distribuciones que son un poco más pesadas de lo normal, pero no alcanzan su punto máximo); la t es mejor en lo normal o más ligero, y la prueba de signos es mejor cuando la distribución tiene un pico fuerte (que a menudo tiende a ir junto con colas muy pesadas, pero no tiene que ser así). [Tenga cuidado, sin embargo, confundiendo estas ideas con simples cambios en la propagación, lo que no altera sus propiedades relativas.] ... Estoy seguro de que podría exprimir algunas de esas oraciones en
Glen_b -Reinstate Monica
Muchas gracias @Glen_b! El problema es que no estoy enseñando el programa, ¡solo lo estoy apoyando! El programa de estudios en la mayoría de los departamentos parece ser: (i) usar una prueba de hipótesis de normalidad (matarme ahora) y en base a eso (ii) usar Wilcoxon o t-Test. Por lo tanto, los detalles más finos de los hombros de la distribución, etc., ni siquiera se tocan, ni tampoco el poder, solo si se cumplen los supuestos (de una manera un poco basura). ¡Pero tus pensamientos son muy útiles para mí personalmente, al menos!
justme
Gran publicación @Glen_b! Entonces, en términos de selección de las dos pruebas, ¿puedo concluir que siempre debemos calcular la potencia primero? ¿En lugar de seguir el supuesto de que siempre usa Sign Test si la distribución de diferencia no es normal? ¡Gracias!
Lumos