Quiero decidir la capacidad de una tabla para que tenga probabilidades residuales inferiores a para desbordarse para , suponiendo que el número de entradas sigue una ley de Poisson con una determinada expectativa .2 - p p ∈ [ 40 ... 120 ] E ∈ [ 10 3 ... 10 12 ]
Idealmente, quiero el número entero más bajo C
tal que 1-CDF[PoissonDistribution[E],C] < 2^-p
para dado p
y E
; pero estoy contento con algunos un C
poco más altos que eso. Mathematica está bien para el cálculo manual, pero me gustaría calcular C
desde p
y E
en tiempo de compilación, lo que me limita a la aritmética de enteros de 64 bits.
Actualización: en Mathematica (versión 7) e = 1000; p = 40; c = Quantile[PoissonDistribution[e], 1 - 2^-p]
está 1231
y parece correcto (gracias @Procrastinator); sin embargo, el resultado para ambos p = 50
y p = 60
es 1250
, lo cual es incorrecto en el lado inseguro (y es importante: mi experimento se repite como veces o más, y quiero demostrablemente menos de probabilidades generales de falla). Quiero una aproximación cruda pero segura usando solo aritmética de enteros de 64 bits , como está disponible en C (++) en tiempo de compilación. 2 - 30
fuente
C = Quantile[PoissonDistribution[E],1-2^p]
?p
cuestiones de signos y precisión, y nombresE
yC
que están reservados). PERO necesito una aproximación simple de eso, posiblemente cruda (pero en el lado seguro) usando aritmética de enteros de 64 bits solamente.Respuestas:
Una distribución de Poisson con una media grande es aproximadamente normal, pero debe tener cuidado de querer un límite de cola y la aproximación normal es proporcionalmente menos precisa cerca de las colas.
Un enfoque utilizado en esta pregunta de MO y con distribuciones binomiales es reconocer que la cola disminuye más rápidamente que una serie geométrica, por lo que puede escribir un límite superior explícito como una serie geométrica.
La línea 2 línea 3 estaba relacionada con la fórmula de Stirling. En la práctica, creo que quiere resolver numéricamente mediante la búsqueda binaria. El método de Newton comienza con una suposición inicial deTambién debería funcionar.→ −plog2=log(bound) D=μ+cμ−−√.
Por ejemplo, con y , la solución numérica que obtengo es 1384.89. Una distribución de Poisson con media toma los valores de a con probabilidadLos valores de a ocurren con probabilidadμ = 1,000 1,000 0 1,384 1 - 1 / 2 100,06 . 0 1383 1 - 1 / 2p=100 μ=1000 1000 0 1384 1−1/2100.06. 0 1383 1−1/299.59.
fuente
Puede ver P. Harremoës: límites agudos en las probabilidades de cola para las variables aleatorias de Poisson https://helda.helsinki.fi/bitstream/handle/10138/229679/witmse_proc_17.pdf Las principales desigualdades son las siguientes. Sea una variable aleatoria de Poisson con parámetro . Ponga Let denota la función de distribución acumulativa para la ley normal estándar. Entonces, para todos los enteros , que es equivalente a para todos los enterosY λ G(x)=2(xlnxλ+λ−x)−−−−−−−−−−−−−−−√ sign(x−λ). Φ k≥0 P(Y<k)≤Φ(G(k))≤P(Y≤k), Φ(G(k−1))≤P(Y<k)≤Φ(G(k)) k>0 . Además, que implica que
para todos los enteros .Φ(G(k+(1/2)))≤P(Y≤k) Φ(G(k−1/2))≤P(Y<k)≤Φ(G(k)) k>0
fuente