¿Cuál es la varianza del máximo de una muestra?

13

Estoy buscando límites en la varianza del máximo de un conjunto de variables aleatorias. En otras palabras, estoy buscando fórmulas de forma cerrada para B , de modo que

Var(maxiXi)B,
DondeX={X1,,XM} es un conjunto fijo deM variables aleatorias con medios finitosμ1,,μM y varianzasσ12,,σM2 .

Puedo deducir que pero este límite parece muy flojo. Una prueba numérica parece indicar que B = máx i σ 2 i podría ser una posibilidad, pero no he sido capaz de demostrar esto. Cualquier ayuda es apreciada.

Var(maxiXi)iσi2,
B=maxiσi2
Peter
fuente
3
(¿Quiere suponer que la es independiente?) La conjetura es plausible pero parece ser falsa. Por ejemplo, realice algunas pruebas en las que X i iid con CDF 1 - x 1 - s , 1 x , s > 3 . La varianza de su máximo, en relación con su varianza común, aumenta sin límite a medida que M crece. XiXi1x1s1xs>3M
whuber
@whuber Gracias, eso explica por qué no pude demostrar esa conjetura :) De hecho, estoy interesado en el caso en el que es independiente. Solo para aclarar, me interesan principalmente los límites generales que usan solo los primeros dos momentos. No estoy seguro de si existen límites generales más agudos que la varianza común. Xi
Peter
1
Debo señalar que su suma enlazada (suponiendo que sea correcta, sería bueno ver un boceto de la prueba) es ajustada. Por ejemplo, que se admitan en el intervalo [ - , a ] con variaciones que no excedan de ε 2 y que X 1 se admitan en [ a , ] . Entonces max i X i = X 1 como, con varianza σ 2 1σ 2 1X2,,XM[,a]ε2X1[a,]maxiXi=X1 , pero la desigualdad se puede apretar tanto como desee reduciendo ε 2 . σ12σ12+(M1)ε2ε2
whuber
1
Para los datos de iid, la teoría del valor extremo proporciona las clases de distribuciones a las que converge el máximo de muestra, con ciertas condiciones en las colas de las distribuciones originales que dan diferentes clases de distribuciones asintóticas. Por lo tanto, dudo que pueda derivar un buen límite basado solo en los dos momentos, aunque solo estoy tangencialmente familiarizado con la teoría.
StasK

Respuestas:

9

Para cualquier variable aleatoria X i , el mejor límite general es V a r ( max X i ) i V a r ( X i ) como se indica en la pregunta original. Aquí hay un bosquejo de prueba: si X, Y son IID, entonces E [ ( X - Y ) 2 ] = 2 V a r ( X ) . Dado un vector de variables posiblemente dependientes ( X 1 , ...nXiVar(maxXi)iVar(Xi)E[(XY)2]=2Var(X) , sea ( Y 1 , ... , Y n ) un vector independiente con la misma distribución conjunta. Para cualquier r > 0 , tenemos por la unión vinculada que P [ | max i X i - max i Y i | 2 > r ] i P [ | X i - Y i | 2 > r ](X1,,Xn)(Y1,,Yn)r>0P[|maxiXimaxiYi|2>r]iP[|XiYi|2>r], e integrando este de 0 a ∞ se obtiene la desigualdad reclamada.dr0

If Xi are IID indicators of events of probability ϵ, then maxXi is an indicator of an event of probability nϵ+O(n2ϵ2). Fixing n and letting ϵ tend to zero, we get Var(Xi)=ϵϵ2 and Var(maxiXi)=nϵ+O(n2ϵ2)

Yuval Peres
fuente
3

Una pregunta sobre MathOverflow está relacionada con esta pregunta.

k

Xi11/1009/10M=10, then the maximum is 1 with probability 11/e, so the variance of the population is 0.09 while the variance of the maximum is about 0.23.

Here are two papers on the variances of order statistics:

Yang, H. (1982) "On the variances of median and some other order statistics." Bull. Inst. Math. Acad. Sinica, 10(2) pp. 197-204

Papadatos, N. (1995) "Maximum variance of order statistics." Ann. Inst. Statist. Math., 47(1) pp. 185-193

I believe the upper bound on the variance of the maximum in the second paper is Mσ2. They point out that equality can't occur, but any lower value can occur for IID Bernoulli random variables.

Douglas Zare
fuente