¿Existe una forma numéricamente estable de calcular los valores de una distribución beta para un entero grande alfa, beta (por ejemplo, alfa, beta> 1000000)?
En realidad, solo necesito un intervalo de confianza del 99% alrededor del modo, si eso de alguna manera facilita el problema.
Agregue : Lo siento, mi pregunta no fue tan clara como pensé. Lo que quiero hacer es esto: tengo una máquina que inspecciona productos en una cinta transportadora. Cierta fracción de estos productos es rechazada por la máquina. Ahora, si el operador de la máquina cambia alguna configuración de inspección, quiero mostrarle la tasa estimada de rechazo y alguna pista sobre cuán confiable es la estimación actual.
Entonces pensé que trataba la tasa de rechazo real como una variable aleatoria X, y calculo la distribución de probabilidad para esa variable aleatoria en función del número de objetos rechazados N y objetos aceptados M. Si supongo una distribución previa uniforme para X, esta es una distribución beta dependiendo de N y M. Puedo mostrar esta distribución al usuario directamente o encontrar un intervalo [l, r] para que la tasa de rechazo real esté en este intervalo con p> = 0,99 (usando la terminología de shabbychef) y mostrar esto intervalo. Para pequeñas M, N (es decir, inmediatamente después del cambio de parámetro), puedo calcular la distribución directamente y aproximar el intervalo [l, r]. Pero para grandes M, N, este enfoque ingenuo conduce a errores de flujo inferior, porque x ^ N * (1-x) ^ M es demasiado pequeño para ser representado como un flotador de doble precisión.
Supongo que mi mejor opción es usar mi ingenua distribución beta para M, N pequeña y cambiar a una distribución normal con la misma media y varianza tan pronto como M, N exceda algún umbral. ¿Tiene sentido?
Respuestas:
A la luz de las ediciones a la pregunta, tenga en cuenta que uno no calcula las integrales beta integrando realmente el integrando: por supuesto, obtendrá desbordamientos (aunque realmente no importan, porque no contribuyen de manera apreciable a la integral) . Hay muchas, muchas formas de calcular la integral o aproximarla, como se documenta en Johnson & Kotz (Distribuciones en estadística). Se encuentra una calculadora en línea en http://www.danielsoper.com/statcalc/calc37.aspx . Realmente necesitas el inverso de esta integral. Algunos métodos para calcular el inverso están documentados en el sitio de Mathematica en http://functions.wolfram.com/GammaBetaErf/InverseBetaRegularized/α=1000000,β=1000001
inverse beta regularized (.005, 1000000, 1000001)
inverse beta regularized (.995, 1000000, 1000001)
fuente
Un experimento gráfico rápido sugiere que la distribución beta se parece mucho a una distribución normal cuando alfa y beta son muy grandes. Al buscar en Google "el límite de distribución beta normal", encontré http://nrich.maths.org/discus/messages/117730/143065.html?1200700623 , que ofrece una "prueba" de saludo manual.
La página de wikipedia para la distribución beta proporciona su media, modo (v cercano a la media para alfa y beta grandes) y varianza, por lo que puede usar una distribución normal con la misma media y varianza para obtener una aproximación. Si es una aproximación lo suficientemente buena para sus propósitos depende de cuáles sean sus propósitos.
fuente
fuente
Por ejemplo
normalmente produce una salida como
es decir, los valores p típicos son alrededor de 0.2.
produce algo como
con valores p típicos alrededor de 0.01
La
qqnorm
función R también proporciona una visualización útil, produciendo una gráfica de aspecto muy directo para la distribución log-odds que indica normalidad aproximada, la distribución de la variable beta dsitribute produce una curva distintiva que indica no normalidadfuente