Varianza del máximo de variables aleatorias gaussianas

11

Dadas variables aleatorias X1,X2,,Xn iid muestreado de N(0,σ2), definir

Z=maxi{1,2,,n}Xi

Tenemos eso E[Z]σ2logn. Me preguntaba si hay límites superiores / inferiores enVar(Z)?

Diablo
fuente
1
Solo para empezar, creo que lo encontrarás Var(Z)σ2(la igualdad se logra en n = 1), y Var (Z) disminuye a medida que n aumenta. Te dejo que proporciones ese límite más estricto en función de n.
Mark L. Stone el
1
La muestra máxima menos la muestra mínima se conoce como el rango de estudiante y sigue la distribución del rango de estudiante si las variables aleatorias subyacentes son IID normales. Eso está al menos vagamente relacionado con lo que estás preguntando ... (podría darte un punto de partida para leer). Volviendo a su pregunta específica, estoy seguro de que podría escribir una simulación de Montecarlo con bastante facilidad para encontrar una respuesta práctica.
Matthew Gunn el
2
Ambas respuestas a stats.stackexchange.com/questions/105745 proporcionan aproximaciones a la desviación estándar (y, por lo tanto, a la varianza), utilizando análisis que pueden producir límites superiores o inferiores.
whuber
Relacionado: stats.stackexchange.com/questions/77110/…
kjetil b halvorsen

Respuestas:

9

Puede obtener el límite superior aplicando la desigualdad de Talagrand: mire el libro de Chatterjee (fenómeno de superconcentración, por ejemplo).

Te dice que Var(f)Ci=1nif221+log(if||2/if1).

Para el máximo, obtienes if=1Xi=max, luego integrándose con respecto a la medida gaussiana en Rnorte usted obtiene if22=if1=1npor simetría (Aquí elijo todos mis rv iid con varianza uno).

Este es el verdadero orden de la variación: dado que tiene un límite superior en la expectativa del máximo, este artículo de Eldan-Ding Zhai (En picos múltiples y desviación moderada del supremum gaussiano) le dice que
Var(maxXi)C/(1+E[maxXi])2

También es posible obtener una fuerte desigualdad de concentración que refleja estos límites en la varianza: puede consultar http://www.wisdom.weizmann.ac.il/mathusers/gideon/papers/ranDv.pdf o, para un proceso gaussiano más general , en mi artículo https://perso.math.univ-toulouse.fr/ktanguy/files/2012/04/Article-3-brouillon.pdf

En general, es bastante difícil encontrar el orden correcto de magnitud de la varianza de un supremum de Gaussien ya que las herramientas de la teoría de la concentración son siempre subóptimas para la función máxima.

¿Por qué necesita este tipo de estimaciones si puedo preguntar?

Tanguy Kevin
fuente
1
Tenga en cuenta que la desigualdad de Talagrand es una mejora de la desigualdad de Poincaré satisfecha por la medida gaussiana estándar. Hay más sobre esto en el artículo de Cordero-Ledoux "Medidas hipercontractivas, desigualdad e influencias de Talagrand".
Tanguy Kevin
2
Muchas gracias. Esto ayuda mucho. Estaba lidiando con el problema en el que intentaba limitar la probabilidad de errores al estimar la longitud de las ejecuciones de 0 en un flujo de bits desde las observaciones a través de un canal de eliminación. Después de una aproximación gaussiana, el máximo parecía ser un estimador natural, y encontré que limitar su rendimiento no era trivial. En mi problema particular, podría encontrar una forma de evitarlo reduciéndolo a un problema de estimación Gaussian MMSE.
Devil
@TanguyKevin, ¿qué es C en el límite inferior?
xsari3x
1

En términos más generales, la expectativa y la variación del rango dependen de cuán gorda sea la cola de su distribución. Para la varianza, esO(nB) dónde B depende de su distribución (B=2 para uniforme, B=1 para gaussiano, y B=0para exponencial.) Ver aquí . La siguiente tabla muestra el orden de magnitud del rango.

ingrese la descripción de la imagen aquí

Vincent Granville
fuente