Dada una secuencia de variables aleatorias iid, digamos, para , estoy tratando de limitar el número esperado de veces la media empírica excederá un valor, , a medida que continuamos tomando muestras, es decir: i = 1 , 2 , . . . , n 1c≥0T d e f = n ∑ j=1P({ 1
Si suponemos que para algunos , podemos usar la desigualdad de Hoeffding para llegar aa > 0
Lo que se ve bien (tal vez) pero en realidad es un límite bastante flojo, ¿hay alguna forma mejor de limitar este valor? Espero que haya una manera, ya que los diferentes eventos (para cada ) claramente no son independientes, no conozco ninguna forma de explotar esta dependencia. Además, sería bueno eliminar la restricción de que es mayor que la media.c
editar : La restricción de que sea mayor que la media se puede eliminar si utilizamos la Desigualdad de Markov de la siguiente manera:
Tc≤E[X]
Respuestas:
Este es un enfoque hecho a mano, y realmente agradecería algún comentario al respecto (y los que critican suelen ser los más útiles). Si entiendo correctamente, el OP calcula medias de muestra , donde cada muestra contiene la observación anterior de la muestra +1 de un nuevo rv la distribución de la media de cada muestra. Entonces podemos escribirx¯j Fj
Considere un tamaño de muestra después de lo cual la distribución de la media de la muestra es casi normal, denotar que . Entonces podemos escribirm G^
Resolviendo obtenemos donde es la normal estándar cdf, es la desviación estándar del proceso iid, y es su media. Insertando en el límite y reorganizando obtenemosG^j(c)
Tenga en cuenta que este límite depende también de la varianza del proceso. ¿Es este un límite mejor que el presentado en la pregunta? Esto dependerá crucialmente de cuán "rápidamente" la distribución de la media de la muestra se vuelva "casi normal". Para dar un ejemplo numérico, suponga que . Suponga también que las variables aleatorias son uniformes en . Entonces y . Considere una desviación del 10% de la media, es decir, establezca . entonces: ya para el límite que propongo (que es significativo para ) se vuelve más estricto. Para el límite de Hoeffding esm=30 [0,1] σ=112−−√ μ=12 a=0.05 n=34 n>30 n=100 78.5 mientras que el límite que propongo es . El límite de Hoeffding converge a mientras que el límite que propongo a Si aumenta discrepancia entre los dos límites se reduce pero permanece visible: para una desviación del 20%, , el límite de Hoeffding converge a mientras que el El límite que propongo converge a (es decir, la suma de los cdf normales contribuye muy poco al límite general).
De manera algo más general, notamos que para el límite Hoeffding converge a36.2 ≈199.5 ≈38.5 a a=0.1 49.5 30.5
n→∞
Dado que para valores pequeños de (que es más bien el caso de interés) convierte en un gran número, todavía existe el caso de que pueda superarlo en la estanqueidad, incluso si la muestra es tal que la distribución de la media de la muestra converge lentamente a La distribución normal.a Hb Ab
fuente