¿Por qué el supremum del puente browniano tiene la distribución Kolmogorov-Smirnov?

La distribución de Kolmogorov-Smirnov se conoce por la prueba de Kolmogorov-Smirnov . Sin embargo, también es la distribución del supremum del puente browniano.

Como esto está lejos de ser obvio (para mí), me gustaría pedirle una explicación intuitiva de esta coincidencia. Las referencias también son bienvenidas.

distributions hypothesis-testing mathematical-statistics stochastic-processes Rasmus
fuente

@GaBorgulya: ¿Qué cambiaste?

Rasmus

Mira aquí y aquí .

cardenal

Respuestas:

$\sqrt{n}\sup_x|F_n-F|=\sup_x|\frac{1}{\sqrt{n}}\sum_{i=1}^nZ_i(x)|$

donde $Z_i(x)=1_{X_i\leq x}-E[1_{X_i\leq x}]$

por CLT tienes $G_n=\frac{1}{\sqrt{n}}\sum_{i=1}^nZ_i(x)\rightarrow \mathcal{N}(0,F(x)(1-F(x)))$

esta es la intuición ...

el puente browniano tiene una varianza http://en.wikipedia.org/wiki/Brownian_bridge reemplaza por . Esto es para una ... $B(t)$ $t(1-t)$ $t$ $F(x)$ $x$

También debe verificar la covarianza y, por lo tanto, aún es fácil mostrar (CLT) que para ( ) donde es con $x_1,\dots,x_k$ $(G_n(x_1),\dots,G_n(x_k))\rightarrow (B_1,\dots,B_k)$ $(B_1,\dots,B_k)$ $\mathcal{N}(0,\Sigma)$ , . $\Sigma=(\sigma_{ij})$ $\sigma_{ij}=\min(F(x_i),F(x_j))-F(x_i)F(x_j)$

La parte difícil es demostrar que la distribución del suppremum del límite es el supremum de la distribución del límite ... Comprender por qué sucede esto requiere cierta teoría empírica del proceso, leer libros como Van der Waart y Welner (no es fácil) . El nombre del teorema es Donsker Theorem http://en.wikipedia.org/wiki/Donsker%27s_theorem ...

robin girard
fuente

¿No deberíamos aplicar el CLT a todas las distribuciones marginales de dimensión finita?

Rasmus

pediste una respuesta intuitiva :) también elijo no molestarte con la parte matemática complicada que es mostrar que la convergencia para todo t implica la convergencia (en la ley) del supremum ... ¿quieres que complete el responder ?

robin girard

Estimado robin girard, creo que su respuesta está bien tal como está. ¡Gracias!

Rasmus

La parte difícil en realidad es mostrar una convergencia débil. La convergencia de supremums se sigue directamente del teorema de mapeo continuo. Este resultado se puede encontrar en "Convergencia de medidas de probabilidad" de Billingsley. Van der Vaart y Wellner dan un resultado más general y su libro es muy, muy duro :)

mpiktas

@robingirard Personalmente me encantaría ver una "respuesta completa" con todas las "partes matemáticas difíciles"

StatsPlease

Para Kolmogorov-Smirnov, considere la hipótesis nula. Dice que una muestra se extrae de una distribución particular. Entonces, si construye la función de distribución empírica para $n$ muestras $f(x) = \frac{1}{n} \sum_i \chi_{(-\infty, X_i]}(x)$ , in the limit of infinite data, it will converge to the underlying distribution.

For finite information, it will be off. If one of the measurements is $q$ , then at $x=q$ the empirical distribution function takes a step up. We can look at it as a random walk which is constrained to begin and end on the true distribution function. Once you know that, you go ransack the literature for the huge amount of information known about random walks to find out what the largest expected deviation of such a walk is.

You can do the same trick with any $p$ -norm of the difference between the empirical and underlying distribution functions. For $p=2$ , it's called the Cramer-von Mises test. I don't know the set of all such tests for arbitrary real, positive $p$ form a complete class of any kind, but it might be an interesting thing to look at.

user873
fuente