Considere un experimento que genera una relación entre 0 y 1. La forma en que se obtiene esta relación no debería ser relevante en este contexto. Se elaboró en una versión anterior de esta pregunta , pero se eliminó para mayor claridad después de una discusión sobre meta .
Este experimento se repite veces, mientras que es pequeño (aproximadamente 3-10). Se supone que es independiente e idénticamente distribuido. A partir de estos, estimamos la media calculando el promedio , pero ¿cómo calcular el intervalo de confianza correspondiente ?n X i ¯ X [ U , V ]
Cuando se utiliza el enfoque estándar para calcular los intervalos de confianza, veces es mayor que 1. Sin embargo, mi intuición es que el intervalo de confianza correcto ...
- ... debe estar dentro del rango 0 y 1
- ... debería hacerse más pequeño con el aumento de
- ... está aproximadamente en el orden del calculado con el enfoque estándar
- ... se calcula mediante un método matemáticamente sólido
Estos no son requisitos absolutos, pero al menos me gustaría entender por qué mi intuición está equivocada.
Cálculos basados en respuestas existentes.
A continuación, los intervalos de confianza resultantes de las respuestas existentes se comparan para .
Enfoque estándar (también conocido como "Matemáticas escolares")
, , por lo tanto, el intervalo de confianza del 99% es . Esto contradice la intuición 1.[ 0,865 , 1,053 ]
Recorte (sugerido por @soakley en los comentarios)
Simplemente usar el enfoque estándar y proporcionar como resultado es fácil de hacer. ¿Pero se nos permite hacer eso? Todavía no estoy convencido de que el límite inferior se mantenga constante (-> 4.)
Modelo de regresión logística (sugerido por @Rose Hartman)
Datos transformados: Resultando en , transformando de nuevo resulta en . Obviamente, el 6.90 es un valor atípico para los datos transformados, mientras que el 0.99 no es para los datos no transformados, lo que resulta en un intervalo de confianza que es muy grande. (-> 3.)[ 0.173 , 7.87 ] [ 0.543 ,
Intervalo de confianza de proporción binomial (sugerido por @Tim)
El enfoque parece bastante bueno, pero desafortunadamente no se ajusta al experimento. Simplemente combinando los resultados e interpretándolo como un gran experimento repetido de Bernoulli como lo sugiere @ZahavaKor resulta en lo siguiente:
de en total. Alimentando esto en el Adj. La calculadora Wald da . ¡Esto no parece ser realista, porque ni un solo está dentro de ese intervalo! (-> 3.)[ 0.9511 , 0.9657 ] X i
Bootstrapping (sugerido por @soakley)
Con tenemos 3125 posibles permutaciones. Tomando el medio de las permutaciones, obtenemos . El aspecto no que mal, aunque me esperaba un mayor intervalo (-> 3.). Sin embargo, es por construcción nunca mayor que . Por lo tanto, para una muestra pequeña, crecerá en lugar de reducirse para aumentar (-> 2.). Esto es al menos lo que sucede con las muestras dadas anteriormente.3093[0.91,0.99][min(Xi),max(Xi)]n
fuente
Respuestas:
Primero, para aclarar, lo que está tratando no es una distribución binomial, como sugiere su pregunta (se refiere a él como un experimento de Bernoulli). Las distribuciones binomiales son discretas: el resultado es éxito o fracaso. Su resultado es una relación cada vez que ejecuta su experimento , no un conjunto de éxitos y fracasos sobre los que luego calcula una relación de resumen. Debido a eso, los métodos para calcular un intervalo de confianza de proporción binomial tirarán mucha de su información. Y, sin embargo, tiene razón en que es problemático tratar esto como si estuviera normalmente distribuido, ya que puede obtener un CI que se extienda más allá del rango posible de su variable.
Recomiendo pensar en esto en términos de regresión logística. Ejecute un modelo de regresión logística con su variable de proporción como resultado y sin predictores. La intercepción y su CI le darán lo que necesita en logits, y luego puede convertirlo nuevamente a proporciones. También puede hacer la conversión logística usted mismo, calcular el CI y luego volver a convertir a la escala original. Mi python es terrible, pero así es como puedes hacer eso en R:
Estos son los límites inferior y superior en un IC del 99% para estos datos:
fuente
Es posible que desee probar remuestreo / bootstrapping. Veamos el caso simple que mencionaste.
Con 3 puntos de datos de 0.99, 0.94 y 0.94, ni siquiera haría el remuestreo porque solo puede enumerar las 27 permutaciones posibles, encontrar la media en cada caso y luego ordenar las medias.
Si crea la lista y toma las 25 observaciones del medio, tiene un intervalo de confianza de 25/27 92.6% de [0.9400, 0.9733]. Si desea aumentar la confianza a 26/27 96.3%, tiene dos opciones de intervalos unilaterales. Ya sea [0.9400, 0.9733] o [0.94, 0.99].26 / 27 =25/27= 26/27=
Supongo que su será mucho mayor que 3, por lo que volverá a muestrear con reemplazo. Digamos que haces esto 1000 veces. Luego encuentra la media en cada caso. Del conjunto de 1000 medias, tome los valores medios de 950. Los valores más bajos y más altos de este subconjunto forman el intervalo de confianza del 95%.n
La pregunta aquí: ¿Cómo creamos un intervalo de confianza para el parámetro de una prueba de permutación? da más detalles, incluido un código R.
fuente
Los intervalos de confianza binomiales han sido objeto de debates estadísticos durante mucho tiempo. Su problema considera una proporción inferior al 100%, pero se vuelve aún más problemático si usamos el 100%. Una forma perspicaz de hacer la pregunta es:
Hay varios métodos para calcular estas colas. Recomiendo consultar Wikipedia para las matemáticas, o si solo desea la respuesta, busque una calculadora de intervalo binomial como esta (que también tiene una explicación más de las matemáticas detrás de ella).
fuente
Un enfoque bayesiano:
fuente