¿Rango y transformación z en lugar de Wilcoxon?

8

Andrew Gelman en una publicación reciente en su blog sugiere usar un rango, transformar el rango en una puntuación z y luego usar pruebas y herramientas paramétricas en lugar de realizar pruebas no paramétricas. Nunca escuché de eso antes.

Una búsqueda en Google me señaló esta función R en el paquete GenABEL , que parece realizar la transformación rango + z de un vector de datos, pero no pude encontrar documentos que evalúen o discutan la idea de usar pruebas paramétricas en los datos transformados. de las pruebas de Wilcoxon.

¿Alguien puede señalarme algo de literatura sobre este método?

Jacques Wainer
fuente
2
Esta no es una prueba paramétrica. Acaba de utilizar una aproximación asintótica de la distribución nula de una estadística basada en rango.
dsaxton
1
@dsaxton En muchos casos es una prueba no paramétrica (o, más bien, una aproximación a una). Reemplazar los rangos con cualquier conjunto fijo de puntajes (dados los tamaños de muestra) no altera la falta de dependencia de las formas de distribución originales bajo el valor nulo.
Glen_b -Reinstate a Monica el

Respuestas:

10

(Saca Conover [1] de la estantería ...)

Esta idea es bastante antigua; se remonta al menos a van der Waerden (1952/1953) [2] [3], quien sugirió una prueba que corresponde al Kruskal Wallis pero con rangos reemplazados por puntajes normales. (La idea de usar valores normales aleatorios ordenados en lugar de una aproximación de sus expectativas o su mediana, es quizás incluso un poco más antigua).

Según Conover, Fisher y Yates (1957) [4] sugieren reemplazar las observaciones con puntuaciones normales esperadas (es decir, rangos transformados) en una variedad de pruebas donde se supondría la normalidad.

La eficiencia relativa asintótica en la normalidad será 1, lo que lo hace parecer bastante atractivo ... sin embargo, la ventaja sobre el Wilcoxon-Mann-Whitney (ganancia de potencia), incluso en la normalidad, es bastante pequeña, y Si la distribución es más pesada de lo normal (por ejemplo, logística), puede ser desventajoso hacer esto. (Algunas simulaciones sugieren que de hecho es así: a menos que la distribución ya sea cercana a lo normal, en cuyo caso no hay ningún beneficio en realizar la transformación, tal transformación puede perder potencia).

Chernoff y Lehmann [5] calculan el poder asintótico para una variedad de distribuciones; donde hay al menos una cola muy corta (como el uniforme), la prueba de puntaje normal puede tener mucho mejor ARE para una alternativa de cambio contra Wilcoxon-Mann-Whitney, mejor que la prueba t en sí. Sus resultados concuerdan con mis simulaciones para casos de colas más pesadas.

Tenga en cuenta que en el caso de dos muestras, a medida que la separación en los medios se hace grande, mientras que la muestra combinada parece bastante normal, las dos muestras no son normales en absoluto:

ingrese la descripción de la imagen aquí

Como resultado, no todas las propiedades de la prueba normal se transferirán a la prueba de puntaje normal, y el comportamiento en separaciones más grandes (con muestras pequeñas) puede ser algo contradictorio.

Las pruebas obtenidas por esta idea a veces se denominan colectivamente pruebas de puntaje normal , cuyo término de búsqueda (a través de Google, por ejemplo) arroja varias referencias.

Por ejemplo, aquí , Richard Darlington habla de hacerlo para la prueba de rangos firmados de Wilcoxon; Señala que hay una ventaja sobre la prueba de rango simple, ya que reduce el número de valores vinculados de la estadística de prueba.

Antes de terminar escribiendo páginas sobre él, te dejaré buscar más.

Conover enumera una serie de otras referencias y tiene una buena discusión, por lo que definitivamente recomendaría leer eso.

El punto de Gelman, sin embargo, parece estar relacionado con la conveniencia , no con la necesidad de desarrollar una nueva prueba cada vez que la situación cambia; aunque si la conveniencia es el problema principal, ya existe la posibilidad de usar pruebas de permutación en cualquier estadística que nos guste. [Con el enfoque de puntaje normal, la dificultad es que aún necesitamos una forma adecuada de clasificar: no se pueden clasificar cosas que no son comparables bajo nulo y esperar el tipo correcto de comportamiento. Hay un problema similar con la prueba de permutación, ya que de igual manera necesita intercambiabilidad bajo nulo.]

Usted menciona una función R, pero puede clasificar y convertir a puntajes normales fácilmente en R simplemente usando funciones que ya vienen con R.

por ejemplo, usando los sleepdatos en R. harías una prueba t de esta manera:

 t.test(extra ~ group, data = sleep)  # Welch
 t.test(extra ~ group, data = sleep, var.equal=TRUE)  # equal-variance
 t.test(qqnorm(extra,plot=FALSE)$x ~ group, data = sleep)  # normal scores

[1] Conover, WJ (1980),
Estadísticas prácticas no paramétricas , 2e.
Wiley pp. 316–327.

(Desde el enlace de Wikipedia anterior parece que en 3e (1999) la discusión comienza en p396)

[2] van der Waerden, BL (1952),
"Ordenar pruebas para el problema de dos muestras y su poder",
Actas de la Koninklijke Nederlandse Akademie van Wetenschappen , Serie A 55 ( Indagationes Mathematicae 14 ), 453–458.

[3] van der Waerden, BL (1953),
"Ordenar pruebas para el problema de dos muestras. II, III",
Actas de la Koninklijke Nederlandse Akademie van Wetenschappen , Serie A 56 ( Indagationes Mathematicae , 15 ), 303–310 y 311–316.

(también hay correcciones al documento de 1952 en la p 80 de ese volumen)

[4] Fisher RA y Yates F. (1957)
Tablas estadísticas para investigación biológica, agrícola y médica , 5e, Oliver & Boyd, Edimburgo.

[5] Hodges, JL; Lehmann, EL (1961),
"Comparación de los puntajes normales y las pruebas de Wilcoxon",
Actas del Cuarto Simposio de Berkeley sobre Estadística matemática y probabilidad, Volumen 1: Contribuciones a la teoría de la estadística , 307-317,
University of California Press, Berkeley, California.
Http://projecteuclid.org/euclid.bsmsp/1200512171 .

Glen_b -Reinstate a Monica
fuente
Glen, este es un tema interesante (sobre el que me gustaría aprender más) y una buena respuesta tuya. Pero, ¿puedo rogarle que agregue algo de carne (discurso / conclusiones) además de solo enlaces? ¿Y, posiblemente, recopilar algunos enlaces a preguntas y respuestas similares en este sitio? Gracias.
ttnphns
Gran tema ¿Hay alguna comparación publicada de manzanas con manzanas de un enfoque no paramétrico y un enfoque de puntajes normales (con prueba paramétrica) para pruebas de diferencias en medias? Mi colega y yo tenemos algunas para pruebas de correlaciones, pero eso es todo lo que sé. En el contexto de correlación, los puntajes normales conducen a una potencia ligeramente mejor que la prueba de rango (correlación de Spearman) o la prueba paramétrica no transformada (Pearson). Tengo curiosidad por saber si se producen resultados similares en otros contextos.
Anthony
1
@Antony. El ítem [5] señalado por Glen, contiene una comparación manzana a manzana de los puntajes normales y Wilcoxon basado en la eficiencia asintótica. El académico enumera 114 citas de ese documento, algunas de ellas deberían proporcionar otras formas de comparación.
Jacques Wainer
1
@Glen_b, para las correlaciones, la ventaja de las puntuaciones normales fue más prominente cuando ambas variables eran extremadamente no normales (por ejemplo, ambas ~χ2,reF=1) yn era grande (> = 20, pero aún mayor mostró mayores ventajas). Otro trabajo sugiere que tanto la asimetría como la curtosis son importantes. Si está interesado, la referencia se puede encontrar aquí: stats.stackexchange.com/questions/131369/…
Anthony
1
Perdón por todos los comentarios, ¡pero no puedo contener un hilo tan divertido! Un pensamiento más: la figura de @ Glen_b señala un problema que Zimmerman (2011) llamó "herencia". Incluso después de la transformación, las muestras separadas pueden "heredar" algunas de las propiedades de la distribución original no transformada. redalyc.org/articulo.oa?id=16917012005
Anthony