Una forma indirecta es la siguiente:
para distribuciones absolutamente continuas, Richard von Mises (en un artículo de 1936 "La distribución de la plus grande de n valeurs" , que parece haber sido reproducido, en inglés, en una edición de 1964 con selección documentos suyos), ha proporcionado la siguiente condición suficiente para que el máximo de una muestra converja al estándar Gumbel, G(x) :
Sea la función de distribución común de iid variables aleatorias, y su densidad común. Entonces síF(x)nf(x)
limx→F−1(1)(ddx(1−F(x))f(x))=0⇒X(n)→dG(x)
Usando la notación habitual para el estándar normal y calculando la derivada, tenemos
ddx(1−Φ(x))ϕ(x)=−ϕ(x)2−ϕ′(x)(1−Φ(x))ϕ(x)2=−ϕ′(x)ϕ(x)(1−Φ(x))ϕ(x)−1
Tenga en cuenta que . Además, para la distribución normal, . Entonces tenemos que evaluar el límite−ϕ′(x)ϕ(x)=xF−1(1)=∞
limx→∞(x(1−Φ(x))ϕ(x)−1)
Pero es la razón de Mill, y sabemos que la razón de Mill para la normal estándar tiende a medida que crece. Entonces(1−Φ(x))ϕ(x)1/xx
limx→∞(x(1−Φ(x))ϕ(x)−1)=x1x−1=0
y se cumple la condición suficiente.
Las series asociadas se dan como
an=1nϕ(bn),bn=Φ−1(1−1/n)
APÉNDICE
Esto es del cap. 10.5 del libro HA David & HN Nagaraja (2003), "Estadísticas de pedidos" (edición 3d) .
ξa=F−1(a) . Además, la referencia a de Haan es "Haan, LD (1976). Ejemplos extremos: una introducción elemental. Statistica Neerlandica, 30 (4), 161-172 " . Pero tenga cuidado porque parte de la notación tiene contenido diferente en de Haan - por ejemplo, en el libro es la función de densidad de probabilidad, mientras que en de Haan significa la función del libro (es decir, la relación de Mill). Además, de Haan examina la condición suficiente ya diferenciada.f(t) f(t)w(t)
La pregunta plantea dos cosas: (1) cómo mostrar que el máximo converge, en el sentido de que converge (en distribución) para secuencias elegidas adecuadamente y , a la distribución estándar de Gumbel y (2) cómo encontrar tales secuencias.X(n) (X(n)−bn)/an (an) (bn)
El primero es bien conocido y documentado en los documentos originales sobre el teorema de Fisher-Tippett-Gnedenko (FTG). El segundo parece ser más difícil; ese es el problema abordado aquí.
Tenga en cuenta que para aclarar algunas afirmaciones que aparecen en otras partes de este hilo, que
El máximo no converge a nada: diverge (aunque extremadamente lento).
Parece haber diferentes convenciones sobre la distribución de Gumbel. Adoptaré la convención de que el CDF de una distribución Gumbel invertida es, a escala y ubicación, dado por . Un máximo adecuadamente estandarizado de las variaciones normales de iid converge a una distribución de Gumbel invertida.1−exp(−exp(x))
Intuición
Cuando los son iid con la función de distribución común , la distribución del máximo esXi F X(n)
Cuando el soporte de no tiene límite superior, como con una distribución Normal, la secuencia de funciones marcha para siempre a la derecha sin límite:F Fn
Se muestran gráficos parciales de para .Fn n=1,2,22,24,28,216
Para estudiar las formas de estas distribuciones, podemos cambiar cada una hacia la izquierda en una cantidad y reescalarla por para hacerlas comparables.bn an
Cada uno de los gráficos anteriores se ha desplazado para colocar su mediana en y para hacer su rango intercuartil de longitud unitaria.0
FTG afirma que las secuencias y se pueden elegir para que estas funciones de distribución converjan puntualmente en cada a alguna distribución de valor extremo , hasta la escala y la ubicación. Cuando es una distribución Normal, la distribución de límite extremo particular es un Gumbel invertido, hasta su ubicación y escala.(an) (bn) x F
Solución
Es tentador emular el Teorema del límite central al estandarizar para que tenga media unitaria y varianza unitaria. Sin embargo, esto es inapropiado, en parte porque FTG se aplica incluso a distribuciones (continuas) que no tienen primer o segundo momento. En cambio, use un percentil (como la mediana) para determinar la ubicación y una diferencia de percentiles (como el IQR) para determinar la propagación. (Este enfoque general debería tener éxito en encontrar y para cualquier distribución continua).Fn an bn
Para la distribución Normal estándar, ¡esto resulta fácil! Deje . Un cuantil de correspondiente a es cualquier valor para el cual . Recordando la definición de , la solución es0<q<1 Fn q xq Fn(xq)=q Fn(x)=Fn(x)
Por lo tanto, podemos establecer
Debido a que, por construcción, la mediana de es y su IQR es , la mediana del valor límite de (que es alguna versión de un Gumbel invertido) debe ser y su IQR debe ser . Deje que el parámetro de escala sea y el parámetro de ubicación sea . Como la mediana es y el IQR se encuentra fácilmente como , los parámetros deben serGn 0 1 Gn 0 1 β α α+βloglog(2) β(loglog(4)−loglog(4/3))
No es necesario que y sean exactamente estos valores: solo necesitan aproximarlos, siempre que el límite de siga siendo esta distribución inversa de Gumbel. El análisis directo (pero tedioso) para una normal estándar indica que las aproximacionesan bn Gn F
funcionará bien (y son lo más simple posible).
Las curvas de color azul claro son gráficos parciales de para utilizando las secuencias aproximadas y . La línea roja oscura representa la distribución inversa de Gumbel con los parámetros y . La convergencia es clara (aunque la tasa de convergencia para negativo es notablemente más lenta).Gn n=2,26,211,216 a′n b′n α β x
Referencias
BV Gnedenko, Sobre la distribución limitante del plazo máximo en una serie aleatoria . En Kotz y Johnson, Breakthroughs in Statistics Volumen I: Fundamentos y teoría básica, Springer, 1992. Traducido por Norman Johnson.
fuente