Aquí en Wikipedia dice:
Para valores suficientemente grandes de , (digamos ), la distribución normal con media y varianza (desviación estándar ), es una excelente aproximación a la distribución de Poisson. Sies mayor que aproximadamente 10, entonces la distribución normal es una buena aproximación si se realiza una corrección de continuidad apropiada, es decir,donde (en minúsculas)es un entero no negativo, se reemplaza por
Lamentablemente esto no se cita. Quiero poder mostrar / probar esto con cierto rigor. ¿Cómo puede realmente decir que la distribución normal es una buena aproximación cuando , cómo cuantifica esta aproximación 'excelente', qué medidas se utilizaron?
Lo más avanzado que tengo con esto es aquí, donde John habla sobre el uso del teorema de Berry-Esseen y aproxima el error en los dos CDF. Por lo que puedo ver, no prueba ningún valor de .
Respuestas:
Entonces hice trampa. Yo usé Mathematica. Entonces, tanto como son asintóticos a como . Pero su diferencia es asintótica a Si Si traza esto en función de , obtendrá la misma curva que se muestra en la penúltima figura en http://www.johndcook.com/blog/normal_approx_to_poisson/ .Pr ( Y ∈ [ n - 1Pr(X=n) 1Pr(Y∈[n−12,n+12]) lambda→∞α(α2-3)e-α2/2
Aquí están los comandos que usé:
Además, con un poco de experimentación, me parece que una mejor aproximación asintótica a es . Entonces el error es que es aproximadamente veces más pequeño.Pr ( Y ∈ [ n - α 2 / 6 , n + 1 - α 2 / 6 ] ) - ( 5 α 4 - 9 α 2 - 6 ) e - α 2 / 2Pr(X=n) Pr(Y∈[n−α2/6,n+1−α2/6]) √
fuente
Glen_b tiene razón en que "buen ajuste" es una noción muy subjetiva. Sin embargo, si desea verificar que su distribución de Poisson es razonablemente normal, puede utilizar una prueba hipotética de Kolmorgov-Smirnov con la hipótesis nula de el CDF proviene de una distribución , suponiendo su muestra vendrá de un poisson ( ). Como en realidad no está probando una muestra, sino una distribución frente a otra, debe pensar detenidamente sobre el tamaño de la muestra y el nivel de significación que asume para esta prueba hipotética (ya que no estamos usando la prueba KS en su forma típica). Es decir:N ( λ , λ ) λH0: N(λ,λ) λ
Ahora, calcule la tasa de error de Tipo II para esta prueba asumiendo que sus datos realmente provienen de un poisson ( ). Su grado de ajuste con una distribución normal será esta tasa de error Tipo II, en el sentido de que las muestras de tamaño n de su distribución particular de poisson serán, en promedio, aceptadas % del tiempo por una prueba de normalidad KS en su selección Nivel significativo.βλ β
De todos modos, esa es solo una forma de conseguir una sensación de "bondad de ajuste". Sin embargo, todos se basan en algunas nociones subjetivas de "bondad" que tendrá que definir por sí mismo.
fuente
La derivación de la distribución binomial podría darle alguna idea.
Tenemos una variable aleatoria binomial;
Alternativamente, esto se puede calcular de forma recursiva;
Si mantiene la condición inicial;
Ahora supongamos que es grande y es pequeño, pero el éxito promedio de es constante . Entonces podemos hacer lo siguiente;n p p(x) (np=λ)
Usamos que .p=λ/n
Cambiamos algunas variables y evaluamos;
Por cálculo sabemos que . También sabemos que porque tanto la parte superior como la inferior son polinomios de grado .limn→∞(1+x/n)n=ex [n(n−1)(n−2)⋯(n−i+1)]/ni≈1 i
Esto lleva a la conclusión de que como :n→∞
Luego puede verificar que y través de la definición. Sabemos que la distribución binomial se aproxima a la normal en las condiciones del Teorema de De Moivre-Laplace siempre que corrija la continuidad, por lo que se reemplaza por .E(X)=λ Var(X)=λ P(X≤x) P(X≤x+0.5)
fuente