Error en la aproximación normal a una distribución de suma uniforme

Un método ingenuo para aproximar una distribución normal es sumar quizás unas variables aleatorias IID distribuidas uniformemente en , luego volver a centrar y reescalar, confiando en el Teorema del límite central. ( Nota al margen : existen métodos más precisos, como la transformación Box-Muller ). La suma de las variables aleatorias IID se conoce como distribución de suma uniforme o distribución de Irwin-Hall . $100$ $[0,1]$ $U(0,1)$

¿Qué tan grande es el error al aproximar una distribución de suma uniforme por una distribución normal?

Cada vez que surge este tipo de pregunta para aproximar la suma de las variables aleatorias del IID, las personas (incluido yo) mencionan el Teorema de Berry-Esseen , que es una versión efectiva del Teorema del límite central dado que existe el tercer momento:

| F_{n} (x) - Φ (x) | \leq \frac{C ρ}{σ^{3} \sqrt{n}}

$|F_n(x) - \Phi(x)| \le \frac{C \rho}{\sigma^3 \sqrt n}$

donde es la función de distribución acumulativa para la suma reescalada de variables aleatorias IID, es el tercer momento central absoluto, es la desviación estándar, y es una constante absoluta que puede tomarse como o incluso . $F_n$ $n$ $\rho$ $E|(X-EX)^3|$ $\sigma$ $C$ $1$ $1/2$

Esto es insatisfactorio. Me parece que la estimación de Berry-Esenen es más cercana a aguda en las distribuciones binomiales que son discretas, con el mayor error en para una distribución binomial simétrica. El error más grande viene en el salto más grande. Sin embargo, la distribución de suma uniforme no tiene saltos. $0$

Las pruebas numéricas sugieren que el error se reduce más rápidamente que . $c/\sqrt n$

Usando 1/2, la estimación Berry – Esseen es $C=1/2$

| F_{n} (x) - Φ (x) | \leq \frac{\frac{1}{2} \frac{1}{32}}{\frac{1}{{\sqrt{12}}^{3}} \sqrt{n}} \approx \frac{0.650}{\sqrt{n}}

$|F_n(x) - \Phi(x)| \le \frac{\frac12 \frac{1}{32}}{\frac{1}{\sqrt{12}^3} \sqrt n} \approx \frac{0.650}{\sqrt n}$

que para es aproximadamente $n=10,20,40$ $0.205$ , y , respectivamente. Las diferencias máximas reales para parecen ser aproximadamente , y , respectivamente, que son mucho más pequeñas y parecen caer como lugar de . $0.145$ $0.103$ $n=10, 20, 40$ $0.00281$ $0.00139$ $0.000692$ $c/n$ $c/\sqrt n$

normal-distribution central-limit-theorem moments approximation Douglas Zare
fuente

Si expande la distribución de la suma en una expansión de Edgeworth , encontrará que

uniformemente en

como

(ya que la distribución uniforme es simétrica), por lo que

suena aproximadamente a la derecha. Debido a la

F_{n} (x) = Φ (x) + n^{- 1} g (x) + o (n^{- 1})

$F_n(x)=\Phi(x)+n^{-1}g(x)+o(n^{-1})$

x

$x$

n \to \infty

$n\rightarrow\infty$

c / n

$c/n$

o (n^{- 1})

$o(n^{-1})$ término, eso no te da un límite sin embargo ...

MånsT

Gracias, parece que también explica el patrón

para muchas otras distribuciones.

c / n

$c/n$

Douglas Zare

Supongamos que sean iid variables aleatorias y consideremos la suma normalizada $U_1, U_2,\dots$ $\mathcal U(-b,b)$ y lanorma asociada

S_{n} = \frac{\sqrt{3} \sum_{i = 1}^{n} U_{i}}{b \sqrt{n}},

$S_n = \frac{\sqrt{3} \sum_{i=1}^n U_i}{b \sqrt{n}} \>,$

sup

$\sup$

donde

es la distribución de

δ_{n} = sup_{x \in R} | F_{n} (x) - Φ (x) |,

$\delta_n = \sup_{x\in\mathbb R} |F_n(x) - \Phi(x)| \>,$

F_{n}

$F_n$

S_{n}

$S_n$

Lema 1 ( Uspensky ): se cumple el siguiente límite en . $\delta_n$

δ_{n} < \frac{1}{7.5 π n} + \frac{1}{π} {(\frac{2}{π})}^{n} + \frac{12}{π^{3} n} \exp (- π^{2} n / 24) .

$\delta_n < \frac{1}{7.5 \pi n} + \frac{1}{\pi}\left(\frac{2}{\pi}\right)^n + \frac{12}{\pi^3 n} \exp(-\pi^2 n / 24) \>.$

Prueba . Ver JV Uspensky (1937), Introducción a la probabilidad matemática , Nueva York: McGraw-Hill, p. 305.

Esto fue mejorado por R. Sherman a lo siguiente.

Lemma 2 ( Sherman ): La siguiente mejora en las reservas de límite de Uspensky.

δ_{n} < \frac{1}{7.5 π n} - (\frac{π}{180} + \frac{1}{7.5 π n}) e^{- π^{2} n / 24} + \frac{1}{(n + 1) π} {(\frac{2}{π})}^{n} + \frac{12}{π^{3} n} e^{- π^{2} n / 24} .

$\delta_n < \frac{1}{7.5 \pi n} - \left(\frac{\pi}{180}+\frac{1}{7.5\pi n}\right) e^{-\pi^2 n / 24} + \frac{1}{(n+1)\pi}\left(\frac{2}{\pi}\right)^n + \frac{12}{\pi^3 n} e^{-\pi^2 n / 24} \>.$

Prueba : Ver R. Sherman, Error de la aproximación normal a la suma de N variables aleatorias , Biometrika , vol. 58, no. 2, 396–398.

$(\sin x) / x$

cardenal
fuente

N = n

$N=n$

@ Procrastinator: Buena captura.

cardenal

2

$2$

Error en la aproximación normal a una distribución de suma uniforme

Respuestas: