¿Calcular "probabilidad de cobertura real" es lo mismo que calcular un "intervalo creíble"?

9

Estaba leyendo un libro de texto de estadísticas de nivel de entrada. En el capítulo sobre la estimación de máxima verosimilitud de la proporción de éxito en datos con distribución binomial, dio una fórmula para calcular un intervalo de confianza y luego mencionó con indiferencia

Considere su probabilidad de cobertura real, es decir, la probabilidad de que el método produzca un intervalo que capture el valor del parámetro verdadero. Esto puede ser bastante menor que el valor nominal.

Y continúa con una sugerencia para construir un "intervalo de confianza" alternativo, que presumiblemente contiene la probabilidad de cobertura real.

Me encontré con la idea de la probabilidad de cobertura nominal y real por primera vez. Al abrirme paso a través de viejas preguntas aquí, creo que lo entendí: hay dos conceptos diferentes que llamamos probabilidad, el primero es qué tan probable es que un evento que aún no ha sucedido producirá un resultado dado, y el segundo es cuán probable es que la suposición de un agente de observación sobre el resultado de un evento ya sucedido sea cierta. También parecía que los intervalos de confianza solo miden el primer tipo de probabilidad, y que algo llamado "intervalos creíbles" mide el segundo tipo de probabilidad. Supuse sumariamente que los intervalos de confianza son los que calculan la "probabilidad de cobertura nominal" y los intervalos creíbles son los que cubren la "probabilidad de cobertura real".

Pero tal vez he malinterpretado el libro (no está del todo claro si los diferentes métodos de cálculo que ofrece son para un intervalo de confianza y un intervalo creíble, o para dos tipos diferentes de intervalo de confianza), o las otras fuentes a las que solía llegar Mi comprensión actual. Especialmente un comentario que recibí sobre otra pregunta,

Intervalos de confianza para frecuentistas, creíbles para bayesianos

me hizo dudar de mis conclusiones, ya que el libro no describía un método bayesiano en ese capítulo.

Por lo tanto, aclare si mi comprensión es correcta o si he cometido un error lógico en el camino.

rumtscho
fuente
La probabilidad de cobertura nominal es la probabilidad de cobertura "objetivo": la que intentamos alcanzar cuando derivamos un método que proporciona un intervalo de confianza. La cobertura real es la cobertura "verdadera". Algunas personas dicen que el intervalo de confianza es exacto cuando la cobertura real es igual a la cobertura nominal. Scotchi y Unwisdom han mencionado que el intervalo de confianza nunca es exacto para datos discretos. Otro ejemplo es cuando usamos un intervalo de confianza asintótico: es exacto solo cuando . Entiendo totalmente su idea porque "actual" también es sinónimo de "presente". n
Stéphane Laurent

Respuestas:

4

En general, la probabilidad de cobertura real nunca será igual a la probabilidad nominal cuando trabaje con una distribución discreta.

El intervalo de confianza se define como una función de los datos. Si está trabajando con la distribución binomial, solo hay muchos resultados posibles ( para ser precisos), por lo que solo hay muchos intervalos de confianza posibles. Dado que el parámetro es continuo, es bastante fácil ver que la probabilidad de cobertura (que es una función de ) no puede ser mejor que aproximadamente el 95% (o lo que sea).p pn+1pp

En general, es cierto que los métodos basados ​​en el CLT tendrán probabilidades de cobertura por debajo del valor nominal, pero otros métodos pueden ser más conservadores.

Falta de sabiduría
fuente
1
Aquí hay una declaración formal útil de la definición: dado un espacio de muestra y un parámetro desconocido , un procedimiento de confianza consiste en un par de funciones tal queEl lado izquierdo de esta expresión es (tenga en cuenta que esto depende de θ) y el RHS es el nivel de confianza nominal . Si el infimum (sobre ) del LHS es igual al RHS, entonces el procedimiento es exacto . theta 1 - α L U : Ohmio R P [ { omega Ohmio | [ L ( ω ) , U ( ω ) ] θ } ]1 - α . probabilidad de cobertura ΩΩ,F,Pθ1α LU:ΩR
P[{ωΩ|[L(ω),U(ω)]θ}]1α.
coverage probabilityΩ
Desconocimiento
8

ππ=π1π=π2π

xnπ

xπUPr(X=x|π=0.7)I(πU0.7)00.39303780.000729010.58180340.010206020.72866160.059535130.84683890.185220140.93715010.324135150.99148760.302526161.00000000.1176491
x 95%π = 0.7 x 1 0.989065 ππU=π:[Pr(X>x|π)=0.95]π=0.7xbajo esta suposición; el cuarto muestra para qué casos el intervalo de confianza calculado cubre el valor del parámetro verdadero, marcándolos con un . Si suma las probabilidades para los casos en que el intervalo de confianza cubre el valor verdadero, obtiene la cobertura real, . Para diferentes valores verdaderos de , la cobertura real será diferente:10.989065π

coberturas

La cobertura nominal solo se logra cuando los valores de los parámetros verdaderos coinciden con los límites superiores obtenibles.

[Acabo de volver a leer su pregunta y noté que el autor dice que el valor real puede ser menor que la probabilidad de cobertura nominal. Así que supongo que están hablando de un método aproximado para calcular el intervalo de confianza, aunque lo que dije anteriormente todavía funciona. El gráfico podría sugerir informar un nivel de confianza promedio de aproximadamente pero, ¿promediar los valores de un parámetro desconocido?]98%

† Exacto en el sentido de que la cobertura real nunca es menor que la cobertura nominal para cualquier valor de , e igual para algunos valores de - @ El sentido de Unwisdom, no @ Stephane.πππ

‡ Los intervalos con límites superior e inferior se usan más comúnmente, por supuesto; pero un poco más complicado de explicar, y solo hay un intervalo exacto para considerar con solo un límite superior. (Ver Blaker (2000), "Curvas de confianza e intervalos de confianza exactos mejorados para distribuciones discretas", Canadian Journal of Statistics , 28 , 4 y las referencias).

Scortchi - Restablece a Monica
fuente
Gracias por responder. Ahora que sé cuál es la probabilidad real de cobertura, ¿tiene alguna idea de por qué el usuario en esta pregunta fue enviado a preguntas que explican la diferencia entre los intervalos creíbles y de confianza? Aquí es donde surgió la idea de que el problema de cobertura real / nominal. La dualidad está relacionada. stats.stackexchange.com/questions/63922/…
rumtscho
Probablemente porque el OP solo da un enlace a donde ha visto los términos "nominal" y "real" (en lugar de resumirlo o citarlo en la pregunta como lo hizo), y luego dedica el resto de su pregunta a su interpretación errónea de su usar en ese contexto.
Scortchi - Restablece a Monica
1

Creo que la diferencia es en realidad sobre el uso de aproximaciones hechas al calcular los intervalos de confianza. Por ejemplo, si usamos el CI bastante estándar de

estimate±1.96×estimated standard error

Podemos llamar a esto un "intervalo de confianza del 95%". Sin embargo, suele ocurrir que aquí se hacen varias aproximaciones. Si no hacemos las aproximaciones, podemos calcular la cobertura real. Una situación típica es subestimar el error estándar. Entonces, los intervalos son demasiado estrechos para capturar el valor verdadero con un 95% de probabilidad. Solo podrían capturar el valor verdadero con una probabilidad del 85%. La probabilidad de "cobertura real" podría calcularse utilizando una simulación de Monte Carlo de algún tipo (por ejemplo, generar conjuntos de datos de muestra utilizando un valor verdadero elegido, luego calcular el IC del 95% para cada uno y encontrar que realmente contenía el valor verdadero).8501000850

probabilidadislogica
fuente