Supongamos que es una clase de distribuciones de probabilidad en reales no negativos parametrizados por , de modo que Me pregunto qué clases conocidas de distribuciones están cerradas tomando el máximo y, es decir, si y son independientes, entonces .
distributions
Ilya
fuente
fuente
Respuestas:
Me parece que proponer distribuciones de valores extremos realmente responde una pregunta diferente. Demostraré que al abordar esta pregunta directamente y mostrarla conduce a distribuciones que no se encuentran entre los tipos de valores extremos.
Consideremos esto desde los primeros principios. Es inmediato, a partir de los axiomas de probabilidad y definición de CDF, que la distribución del máximo de dos variables aleatorias independientes con CDF y tiene para su CDF. Supongamos que existe una clase de distribuciones que está cerrada por pares de máximo; es decir,F1 F2 F1F2 Ω={Fθ}
Es conveniente tomar logaritmos, extendiendo (como en los textos de análisis avanzados de Rudin) los números reales para incluir como el registro de . Los registros de CDF de variables aleatorias esencialmente compatibles con son (i) monóticamente no crecientes, (ii) igual a on , (iii) tienen límites correctos de , y ( iv) son cadlag. Desde este punto de vista, debe ser un subconjunto convexo de un cono dentro del espacio de funciones cadlag en . Para que se parametrice finitamente, ese cono debe generar un subespacio vectorial de dimensión finita. Eso todavía deja muchas posibilidades.−∞ 0 [0,∞) −∞ (−∞,0) 0 Ω R
Algunas de estas posibilidades son bien conocidas. Considere, por ejemplo, el CDF de una variable uniforme en . Su CDF es igual a en , cuando y en . El cono que genera es el conjunto de CDF de la forma[0,1] 0 (−∞,0] x 0≤x≤1 1 [1,∞)
parametrizado por . Claramente, el máximo de dos variables aleatorias independientes con distribuciones en esta familia tiene una distribución también en esta familia (sus parámetros simplemente se suman). Podemos, si lo deseamos, restringir a un subconjunto convexo de la forma y todavía tienen una familia máxima cerrada. Tenga en cuenta, por favor, que ningún miembro de esta familia es una distribución de valor extremo.θ>0 {Fθ|θ≥θ0}
Esta formulación incluye distribuciones discretas (que obviamente no se encuentran entre los tres tipos de distribuciones de valores extremos). Por ejemplo, considere las distribuciones soportadas en los números naturales para los cuales las probabilidades están dadas por0,1,2,…,k,…
(tomando cuando ), parametrizado por . Por construcción, el CDF , de donde sigueθ1/k=0 k=0 0<θ<1 Fθ(k)=θ1/(k+1)
y debido a que los supuestos implican , esto muestra que la familia está cerrada por pares máximos.0<θϕ<1
Espero que este análisis y estos dos ejemplos muestren que, contrariamente a una opinión expresada en un comentario, el enfoque de comenzar con un número finito de CDF bien elegidos y cerrarlos con respecto al máximo por pares (es decir, formando sus conos en un espacio vectorial relacionado apropiado) no solo es constructivo sino que produce clases de distribuciones interesantes y potencialmente útiles.
fuente
Nota: Esta respuesta asume que las variables están distribuidas de manera idéntica , no solo distribuidas de acuerdo con la misma clase.
Esas serían las distribuciones de valor extremo . Hay tres de ellos, como se presentan generalmente, que corresponden a tres conjuntos de condiciones en la distribución subyacente para los cuales se encuentra la distribución limitante del máximo. Se cierran para encontrar el máximo, que es lo que quieres.
Copia más o menos de una versión anterior de Métodos de Análisis Estadístico para Datos de Confiabilidad y Vida (Mann, Schafer, Singpurwalla),
Tipo I:FX(n)(x)=exp{−exp[−x−γα]}, −∞<x<∞, α>0
Tipo II:FX(n)(x)=exp{−(x−γα)−β}, x≥γ, α,β>0
Tipo III:FX(n)(x)=exp{−[−(x−γα)β]}. x≤γ, α,β>0
Editar: ¡Lea los comentarios, que amplían esta respuesta para hacer una respuesta mucho mejor y más completa a esta pregunta!
fuente
Jbowman me ganó la respuesta. Una explicación de por qué funcionan es que el teorema de Gnedenko establece que si es una secuencia de variables aleatorias distribuidas idénticamente independientes bajo ciertas condiciones en la cola de la distribución converge a 1 de los tres tipos que jbowman enumeró en su respuesta. Ahora, dado que cualquier distribución de tipo I, tipo II o tipo III se puede expresar como el límite del máximo de una secuencia iid, entonces si es decir tipo I y es la distribución límite de como tiende al infinito y también es de tipo I y es el límite deX1,…,Xn n Mn=max(X1,X2,…,Xn) G1 Mn=max(X1,X2,…,Xn) n G2 Nn=max(Y1,Y2,dotsc,Yn) luego decir y es la distribución del límite cuando tiende a infinito para entonces será de tipo I y sea la distribución para el máximo de una va con distribución y otro con distribución y por lo tanto, el tipo I está cerrado bajo maximización. El mismo argumento funciona para los tipos II y III.Vn=max(Mn,Nn) G3 n Vn G3 G1 G2
fuente