Es bien sabido que la eficiencia relativa asintótica (ARE) de la prueba de rango con signo de Wilcoxon es comparación con lapruebat deStudent, si los datos se obtienen de una población distribuida normalmente. Esto es cierto tanto para la prueba básica de una muestra como para la variante de dos muestras independientes (la Wilcoxon-Mann-Whitney U). También es el ARE de una prueba de Kruskal-Wallis en comparación con unapruebaANOVAF, para datos normales.
¿Este resultado notable (para mí, una de las " apariciones más inesperadas de ") y notablemente simple tiene una prueba perspicaz, notable o simple?
Respuestas:
Breve resumen de ARE para la prueba una muestrat , la prueba firmada y la prueba de rango firmado
Espero que la versión larga de la respuesta de @ Glen_b incluya un análisis detallado para la prueba de rango con signo de dos muestras junto con la explicación intuitiva del ARE. Así que me saltearé la mayor parte de la derivación. (caso de una muestra, puede encontrar los detalles que faltan en Lehmann TSH).
Problema de prueba : SeaX1,…,Xn una muestra aleatoria del modelo de ubicación f(x−θ) , simétrica con respecto a cero. Debemos calcular ARE de prueba con signo, prueba de rango con signo para la hipótesis H0:θ=0 relación con la prueba t.
Para evaluar la eficiencia relativa de las pruebas, solo se consideran alternativas locales porque las pruebas consistentes tienen una potencia que tiende a 1 frente a la alternativa fija. Las alternativas locales que dan lugar al poder asintótico no trivial a menudo tienen la formaθn=h/n−−√ para fijo , que se llama deriva de Pitman en alguna literatura.h
Nuestra tarea por delante es
Prueba de estadísticas y asintóticas
Por lo tanto, A R E ( W n ) = ( √
Observación sobre la derivación de distribución bajo la alternativa
Por supuesto, hay muchas formas de derivar la distribución limitante bajo la alternativa. Un enfoque general es usar el tercer lema de Le Cam. La versión simplificada de los estados
For quadratic mean differentiable densities, local asymptotic normality and contiguity are automatically satisfied, which in turn implies Le Cam lemma. Using this lemma, we only need to computecov(Wn,Δn) under the null. Δn obeys LAN
fuente
This has nothing to do with explaining whyπ appears (which was explained nicely by others) but may help intuitively. The Wilcoxon test is a t -test on the ranks of Y whereas the parametric test is computed on the raw data. The efficiency of the Wilcoxon test with respect to the t -test is the square of the correlation between the scores used for the two tests. As n→∞ the squared correlation converges to π3 . You can easily see this empirically using R:
fuente
n <- 1e6; x <- rnorm(n); cor(x, rank(x))^2
(which obviously produces the same result)?Short version: The basic reason with the Wilcoxon-Mann-Whitney under a shift alternative is that finding the asymptotic relative efficiency (WMW/t) corresponds to evaluating12σ2[∫f2(x)dx]2 where f is the common density at the null and σ is the common variance.
So at the normal,f2 is effectively a scaled version of f ; its integral will have a 1π√ term; when squared, that's the source of the π .
The same term - with the same integral - is involved in the ARE for the signed rank test, so it takes the same value.
For the sign test relative to t, the ARE is4σ2f(0)2 ... and f(0)2 again has a π in it.
So essentially it's as I said in comments;π is in the ARE for the Wilcoxon-Mann-Whitney vs the two-sample t test, for the Wilcoxon signed rank test vs the one-sample t and the sign test vs the one-sample t test (in each case at the normal) quite literally because it appears in the normal density.
Reference:
J. L. Hodges and E. L. Lehmann (1956),
"The Efficiency of Some Nonparametric Competitors of the t-Test",
Ann. Math. Statist., 27:2, 324-335.
fuente