¿Cuál es la mejor técnica para calcular un intervalo de confianza de un experimento binomial, si su estimación es que (o similarmente ) y el tamaño de la muestra es relativamente pequeño, por ejemplo ?p = 1 n = 25
confidence-interval
binomial
Kasper
fuente
fuente
scipy.stats.beta.ppf(1−$\alpha$;x+1,n−x)
scipy.stats.beta.ppf(1−$\alpha$;x+1,n−x)
Respuestas:
No utilice la aproximación normal.
Mucho se ha escrito sobre este problema. Un consejo general es nunca usar la aproximación normal (es decir, el intervalo de confianza asintótico / de Wald), ya que tiene propiedades de cobertura terribles. Código R para ilustrar esto:
Para probabilidades de éxito pequeñas, puede pedir un intervalo de confianza del 95%, ¡pero en realidad obtener, digamos, un intervalo de confianza del 10%!
Recomendaciones
Entonces, ¿ qué debemos usar? Creo que las recomendaciones actuales son las que figuran en la estimación de intervalo de papel para una proporción binomial de Brown, Cai y DasGupta en Statistical Science 2001, vol. 16, no. 2, páginas 101–133. Los autores examinaron varios métodos para calcular los intervalos de confianza y llegaron a la siguiente conclusión.
El intervalo de Wilson también se llama a veces intervalo de puntuación , ya que se basa en invertir una prueba de puntuación.
Calculando los intervalos
Para calcular estos intervalos de confianza, puede usar esta calculadora en línea o la
binom.confint()
función en elbinom
paquete en R. Por ejemplo, para 0 éxitos en 25 ensayos, el código R sería:Aquí
bayes
está el intervalo de Jeffreys. (El argumentotype="central"
es necesario para obtener el intervalo de igual cola ).Tenga en cuenta que debe decidir cuál de los tres métodos desea utilizar antes de calcular el intervalo. Mirar los tres y seleccionar el más corto naturalmente le dará una probabilidad de cobertura demasiado pequeña.
Una respuesta rápida y aproximada.
Como nota final, si observa exactamente cero éxitos en sus n pruebas y solo desea un intervalo de confianza aproximado muy rápido, puede usar la regla de tres . Simplemente divide el número 3 por n . En el ejemplo anterior, n es 25, entonces el límite superior es 3/25 = 0.12 (el límite inferior es, por supuesto, 0).
fuente
bayes
usa el uniforme anterior (en lugar del de Jeffrey) cuando ambos parámetros de forma son 1. Envié un correo electrónico al mantenedor del paquete binom por curiosidad sobre las (des) ventajas de Jeffrey vs. uniforme anterior y me dijo que una nueva versión usará El uniforme anterior como predeterminado. Así que no se pregunte si los resultados varían ligeramente en el futuro.binconf
métodoHmisc
también calcula estos intervalos. El valor predeterminado es el método Wilson.fuente