Quiero decidir la capacidad de una tabla para que tenga probabilidades residuales inferiores a para desbordarse para , suponiendo que el número de entradas sigue una ley de Poisson con una determinada expectativa .2 - p p ∈ [ 40 ... 120 ] E ∈ [ 10 3 ... 10 12 ]
Idealmente, quiero el número entero más bajo Ctal que 1-CDF[PoissonDistribution[E],C] < 2^-ppara dado py E; pero estoy contento con algunos un Cpoco más altos que eso. Mathematica está bien para el cálculo manual, pero me gustaría calcular Cdesde py Een tiempo de compilación, lo que me limita a la aritmética de enteros de 64 bits.
Actualización: en Mathematica (versión 7) e = 1000; p = 40; c = Quantile[PoissonDistribution[e], 1 - 2^-p]está 1231y parece correcto (gracias @Procrastinator); sin embargo, el resultado para ambos p = 50y p = 60es 1250, lo cual es incorrecto en el lado inseguro (y es importante: mi experimento se repite como veces o más, y quiero demostrablemente menos de probabilidades generales de falla). Quiero una aproximación cruda pero segura usando solo aritmética de enteros de 64 bits , como está disponible en C (++) en tiempo de compilación. 2 - 30
fuente

C = Quantile[PoissonDistribution[E],1-2^p]?pcuestiones de signos y precisión, y nombresEyCque están reservados). PERO necesito una aproximación simple de eso, posiblemente cruda (pero en el lado seguro) usando aritmética de enteros de 64 bits solamente.Respuestas:
Una distribución de Poisson con una media grande es aproximadamente normal, pero debe tener cuidado de querer un límite de cola y la aproximación normal es proporcionalmente menos precisa cerca de las colas.
Un enfoque utilizado en esta pregunta de MO y con distribuciones binomiales es reconocer que la cola disminuye más rápidamente que una serie geométrica, por lo que puede escribir un límite superior explícito como una serie geométrica.
La línea 2 línea 3 estaba relacionada con la fórmula de Stirling. En la práctica, creo que quiere resolver numéricamente mediante la búsqueda binaria. El método de Newton comienza con una suposición inicial deTambién debería funcionar.→ −plog2=log(bound) D=μ+cμ−−√.
Por ejemplo, con y , la solución numérica que obtengo es 1384.89. Una distribución de Poisson con media toma los valores de a con probabilidadLos valores de a ocurren con probabilidadμ = 1,000 1,000 0 1,384 1 - 1 / 2 100,06 . 0 1383 1 - 1 / 2p=100 μ=1000 1000 0 1384 1−1/2100.06. 0 1383 1−1/299.59.
fuente
Puede ver P. Harremoës: límites agudos en las probabilidades de cola para las variables aleatorias de Poisson https://helda.helsinki.fi/bitstream/handle/10138/229679/witmse_proc_17.pdf Las principales desigualdades son las siguientes. Sea una variable aleatoria de Poisson con parámetro . Ponga Let denota la función de distribución acumulativa para la ley normal estándar. Entonces, para todos los enteros , que es equivalente a para todos los enterosY λ G(x)=2(xlnxλ+λ−x)−−−−−−−−−−−−−−−√ sign(x−λ). Φ k≥0 P(Y<k)≤Φ(G(k))≤P(Y≤k), Φ(G(k−1))≤P(Y<k)≤Φ(G(k)) k>0 . Además, que implica que
para todos los enteros .Φ(G(k+(1/2)))≤P(Y≤k) Φ(G(k−1/2))≤P(Y<k)≤Φ(G(k)) k>0
fuente