¿Por qué la eficiencia relativa asintótica de la prueba de Wilcoxon

13

Es bien sabido que la eficiencia relativa asintótica (ARE) de la prueba de rango con signo de Wilcoxon es 3π0.955comparación con lapruebat deStudent, si los datos se obtienen de una población distribuida normalmente. Esto es cierto tanto para la prueba básica de una muestra como para la variante de dos muestras independientes (la Wilcoxon-Mann-Whitney U). También es el ARE de una prueba de Kruskal-Wallis en comparación con unapruebaANOVAF, para datos normales.

¿Este resultado notable (para mí, una de las " apariciones más inesperadas deπ ") y notablemente simple tiene una prueba perspicaz, notable o simple?

Lepisma
fuente
Dada la aparición de π en el CDF normal, la aparición de π en el son realmente no debería ser todo lo que es sorprendente. Arriesgaré una respuesta, pero tomará un tiempo hacer una buena.
Glen_b -Reinstale a Monica el
1
@Glen_b De hecho, he visto una discusión de "por qué π aparece tanto en las estadísticas" antes (aunque no recuerdo si estaba en CV o no) y "debido a la distribución normal" Sé que surge mucho, pero 3/π sigue siendo gratamente sorprendente la primera vez que lo ves. En comparación, el ARE de Mann-Whitney versus la prueba t de dos muestras es 3 en datos exponenciales, 1.5 en doble exponencial y 1 en uniforme, ¡mucho más redondo!
Silverfish
1
@Silverfish He vinculado la página 197 de van der Vaart "Estadísticas asintóticas". Para una muestra, las pruebas de signos tienen ARE 2/π relación con la prueba t.
Khashaa
1
@Silverfish ... y en la logística es (π/3)2 . Hay bastantes de los ARE conocidos (en uno o dos casos de muestra) que involucran a π y bastantes que son proporciones simples de enteros.
Glen_b -Reinstate Monica
1
Para una prueba de rango con signo de una muestra, parece ser 3/π . Para la prueba de signo de una muestra, es 2/π . Entonces, aclaramos nuestra posición. Creo que es una buena señal.
Khashaa

Respuestas:

10

Breve resumen de ARE para la prueba una muestra t, la prueba firmada y la prueba de rango firmado

Espero que la versión larga de la respuesta de @ Glen_b incluya un análisis detallado para la prueba de rango con signo de dos muestras junto con la explicación intuitiva del ARE. Así que me saltearé la mayor parte de la derivación. (caso de una muestra, puede encontrar los detalles que faltan en Lehmann TSH).

Problema de prueba : Sea X1,,Xn una muestra aleatoria del modelo de ubicación f(xθ) , simétrica con respecto a cero. Debemos calcular ARE de prueba con signo, prueba de rango con signo para la hipótesis H0:θ=0 relación con la prueba t.

Para evaluar la eficiencia relativa de las pruebas, solo se consideran alternativas locales porque las pruebas consistentes tienen una potencia que tiende a 1 frente a la alternativa fija. Las alternativas locales que dan lugar al poder asintótico no trivial a menudo tienen la forma θn=h/n para fijo , que se llama deriva de Pitman en alguna literatura.h

Nuestra tarea por delante es

  • encuentre la distribución límite de cada estadística de prueba bajo nulo
  • encuentre la distribución límite de cada estadística de prueba bajo la alternativa
  • calcular el poder asintótico local de cada prueba

Prueba de estadísticas y asintóticas

  1. prueba t (dada la existencia de ) t nσt n =
    tn=nX¯σ^dN(0,1)under the null
    tnorte=norteX¯σ^renorte(h/ /σ,1)bajo la alternativa θ=h/ /norte
    • entonces la prueba que rechaza si tiene la función de potencia asintótica 1 - Φ ( z α - h 1tnorte>zα
      1Φ(zαh1σ)
  2. prueba firmada Sn=1ni=1n1{Xi>0}
    n(Sn12)dN(0,14)under the null 
    y tiene poder asintótico local 1 - Φ ( z α - 2 h f ( 0 ) )
    n(Sn12)dN(hf(0),14)under the alternative 
    1Φ(zα2hf(0))
  3. prueba de rangos con signo W n d N ( 2 h f 2 , 1
    Wn=n2/3i=1nRi1{Xi>0}dN(0,13)under the null 
    y tiene poder asintótico local 1 - Φ ( z α -
    WndN(2hf2,13)under the alternative 
    1Φ(zα12hf2)

Por lo tanto, A R E ( W n ) = (

ARE(Sn)=(2f(0)σ)2
Sifes la densidad normal estándar,ARE(Sn)=2/π,ARE(Wn)=3/π
ARE(Wn)=(12f2σ)2
fARE(Sn)=2/πARE(Wn)=3/π

fARE(Sn)=1/3ARE(Wn)=1/3

Observación sobre la derivación de distribución bajo la alternativa

Por supuesto, hay muchas formas de derivar la distribución limitante bajo la alternativa. Un enfoque general es usar el tercer lema de Le Cam. La versión simplificada de los estados

ΔnWn

(Wn,Δn)dN[(μσ2/2),(σW2ττσ2/2)]
under the null, then
WndN(μ+τ,σW2)under the alternative

For quadratic mean differentiable densities, local asymptotic normality and contiguity are automatically satisfied, which in turn implies Le Cam lemma. Using this lemma, we only need to compute cov(Wn,Δn) under the null. Δn obeys LAN

Δnhni=1nl(Xi)12h2I0
where l is score function, I0 is information matrix. Then, for instance, for signed test Sn
cov(n(Sn1/2),Δn)=hcov(1{Xi>0},ff(Xi))=h0f=hf(0)
Khashaa
fuente
+1 I wasn't going to go into quite this much detail (indeed, with your answer covering things quite nicely already, I probably won't add anything to what I have now) so if you want to put more detail, don't hold back on my account. I would have been several days yet (and still for less than you have already), so it's a good thing you came in.
Glen_b -Reinstate Monica
This is a nice answer particularly for adding in Le Cam's lemma (+1). It seems to me there is quite a big jump between establishing the asymptotics in 1, 2, and 3, and the "therefore" bit where you write the AREs. I think if I were writing this up, I'd define asymptotic efficiency at this point (or maybe earlier, so the upshot of points 1, 2 and 3 would be the AEs not just local asymptotic powers in each case) and then the step to the AREs would be much easier for future readers to follow.
Silverfish
Quizás valga la pena especificar su H1? Los casos unilaterales y bilaterales tienen poderes asintóticos de aspecto diferente (aunque conducen a los mismos ARE).
Silverfish
Feel free to edit my answer or append it to the OP.
Khashaa
1
@Khashaa Thanks. I shall edit your post when I have the right stuff in front of me. Would you mind clarifying the meaning of the in the final equation?
Silverfish
6

This has nothing to do with explaining why π appears (which was explained nicely by others) but may help intuitively. The Wilcoxon test is a t-test on the ranks of Y whereas the parametric test is computed on the raw data. The efficiency of the Wilcoxon test with respect to the t-test is the square of the correlation between the scores used for the two tests. As n the squared correlation converges to π3. You can easily see this empirically using R:

n <- 1000000; x <- qnorm((1:n)/(n+1)); cor(1:n, x)^2; 3/pi
[1] 0.9549402
[1] 0.9549297
n <- 100000000; x <- qnorm((1:n)/(n+1)); cor(1:n, x)^2; 3/pi
[1] 0.9549298
[1] 0.9549297
Frank Harrell
fuente
This is indeed a very helpful comment. Is it slightly conceptually closer to do n <- 1e6; x <- rnorm(n); cor(x, rank(x))^2 (which obviously produces the same result)?
Silverfish
(People intrigued by Frank's comment may want to look at this question about the equivalence of Wilcoxon-Mann-Whitney U and a t-test on the ranks.)
Silverfish
something I don't understand about this answer is that the correlation is higher for lower values of n (I think the proximal reason is that we don't see the tails very well for smaller n). Naively that implies that the relative efficiency of the Wilcoxon is higher for small n, which surprises me ... ?? (I might do some simulations, but (a) if there's an easy answer ... and (b) am I missing a conceptual point somewhere?)
Ben Bolker
To my recollection the small sample efficiency of both the Wilcoxon signed rank test and the W-M-W are a bit lower than the asymptotic value on shift alternatives at the normal distribution.
Glen_b -Reinstate Monica
5

Short version: The basic reason with the Wilcoxon-Mann-Whitney under a shift alternative is that finding the asymptotic relative efficiency (WMW/t) corresponds to evaluating 12σ2[f2(x)dx]2 where f is the common density at the null and σ is the common variance.

So at the normal, f2 is effectively a scaled version of f; its integral will have a 1π term; when squared, that's the source of the π.

The same term - with the same integral - is involved in the ARE for the signed rank test, so it takes the same value.

For the sign test relative to t, the ARE is 4σ2f(0)2... and f(0)2 again has a π in it.

So essentially it's as I said in comments; π is in the ARE for the Wilcoxon-Mann-Whitney vs the two-sample t test, for the Wilcoxon signed rank test vs the one-sample t and the sign test vs the one-sample t test (in each case at the normal) quite literally because it appears in the normal density.

Reference:

J. L. Hodges and E. L. Lehmann (1956),
"The Efficiency of Some Nonparametric Competitors of the t-Test",
Ann. Math. Statist., 27:2, 324-335.

Glen_b -Reinstate Monica
fuente
I like the explanation for the intuition for the appearance of π in the denominator; is it essentially coincidence that the Renyi entropy turns up in the WMW/Wilcoxon integrals?
Silverfish
@Silverfish That f2dx turns up is certainly not coincidence. However, that's not because that's connected to Rényi entropy, or at least I don't see any direct connection. We're getting into stuff I don't really know about now, though.
Glen_b -Reinstate Monica
@Silverfish It's only a Renyi entropy for α=2. Otherwise, it is just a plain old square that can come up in a million different ways.
abalter