Ejemplos de cuándo coinciden el intervalo de confianza y el intervalo creíble

11

En el artículo de Wikipedia sobre el intervalo creíble , dice:

Para el caso de un solo parámetro y datos que se pueden resumir en una sola estadística suficiente, se puede demostrar que el intervalo creíble y el intervalo de confianza coincidirán si el parámetro desconocido es un parámetro de ubicación (es decir, la función de probabilidad directa tiene la forma Pr (x | μ) = f (x - μ)), con un previo que es una distribución plana uniforme; [5] y también si el parámetro desconocido es un parámetro de escala (es decir, la función de probabilidad directa tiene la forma Pr (x | s) = f (x / s)), con un Jeffreys 'anterior [5] - el último siguiente porque tomar el logaritmo de dicho parámetro de escala lo convierte en un parámetro de ubicación con una distribución uniforme. Pero estos son casos claramente especiales (aunque importantes); en general no se puede hacer tal equivalencia ".

¿Podría la gente dar ejemplos específicos de esto? ¿Cuándo corresponde el IC del 95% al ​​"95% de probabilidad", "violando" la definición general de IC?

Wayne
fuente

Respuestas:

13

distribución normal:

Tome una distribución normal con varianza conocida. Podemos tomar esta varianza como 1 sin perder la generalidad (simplemente dividiendo cada observación por la raíz cuadrada de la varianza). Esto tiene distribución de muestreo:

p(X1...XN|μ)=(2π)N2exp(12i=1N(Xiμ)2)=Aexp(N2(X¯μ)2)

Donde es una constante que depende solo de los datos. Esto muestra que la media de la muestra es una estadística suficiente para la media de la población. Si usamos un uniforme anterior, entonces la distribución posterior para será:μAμ

(μ|X1...XN)Normal(X¯,1N)(N(μX¯)|X1...XN)Normal(0,1)

Entonces un intervalo creíble tendrá la forma:1α

(X¯+1NLα,X¯+1NUα)

Donde y se eligen de manera que una variable aleatoria normal estándar satisfaga: U α ZLαUαZ

Pr(Lα<Z<Uα)=1α

Ahora podemos comenzar con esta "cantidad fundamental" para construir un intervalo de confianza. La distribución de muestreo de para fijo es una distribución normal estándar, por lo que podemos sustituir esto en la probabilidad anterior:μN(μX¯)μ

Pr(Lα<N(μX¯)<Uα)=1α

Luego, vuelva a organizar para resolver , y el intervalo de confianza será el mismo que el intervalo creíble.μ

Parámetros de escala:

Para los parámetros de escala, los archivos PDF tienen la forma . Podemos tomar el , que corresponde a . La distribución conjunta de muestreo es:p(Xi|s)=1sf(Xis)(Xi|s)Uniform(0,s)f(t)=1

p(X1...XN|s)=sN0<X1...XN<s

De donde encontramos que la estadística suficiente es igual a (el máximo de las observaciones). Ahora encontramos su distribución de muestreo:Xmax

Pr(Xmax<y|s)=Pr(X1<y,X2<y...XN<y|s)=(ys)N

Ahora podemos hacer esto independiente del parámetro tomando . Esto significa que nuestra "cantidad fundamental" viene dada por con que es la distribución . Entonces, podemos elegir usando los cuantiles beta de manera que:y=qsQ=s1XmaxPr(Q<q)=qNbeta(N,1)Lα,Uα

Pr(Lα<Q<Uα)=1α=UαNLαN

Y sustituimos la cantidad fundamental:

Pr(Lα<s1Xmax<Uα)=1α=Pr(XmaxLα1>s>XmaxUα1)

Y ahí está nuestro intervalo de confianza. Para la solución bayesiana con jeffreys antes tenemos:

p(s|X1...XN)=sN1XmaxrN1dr=N(Xmax)NsN1
Pr(s>t|X1...XN)=N(Xmax)NtsN1ds=(Xmaxt)N

Ahora conectamos el intervalo de confianza y calculamos su credibilidad

Pr(XmaxLα1>s>XmaxUα1|X1...XN)=(XmaxXmaxUα1)N(XmaxXmaxLα1)N

=UαNLαN=Pr(Lα<Q<Uα)

Y listo, tenemos credibilidad y cobertura .1α

probabilidadislogica
fuente
Una obra maestra, gracias! Esperaba que pudiera haber una respuesta como "al calcular la media de una muestra a partir de una distribución Normal, el IC del 95% también es el intervalo creíble del 95%" o algo así como simple. (Solo inventando esta supuesta respuesta, no tengo idea de ejemplos específicos).
Wayne
Creo que un intervalo frecuente de predicción / tolerancia del 95% corresponde a un intervalo de predicción bayesiano con regresión de OLS y errores normales. Parece que cuando comparo la respuesta de predic.lm con una respuesta simulada, de todos modos. ¿Es eso cierto?
Wayne
Para , si usa un uniforme anterior para y jeffreys antes para , entonces tiene equivalencia. α , β σY=α+βXα,βσ
probabilityislogic
¡Muchas gracias! He estado tratando de explicar un CI para una regresión que he hecho en términos de un intervalo de confianza, y simplemente no se conecta con una audiencia laica, que espera un intervalo creíble. Me hace la vida mucho más fácil ... aunque quizás sea malo para el mundo estadístico en general, ya que reforzará el malentendido de los CI por parte de los legos.
Wayne
@Wayne: la situación es un poco más general que solo las familias de escala de ubicación. Por lo general, un IC será equivalente a un intervalo creíble, si se basa en una "estadística suficiente" (como lo fueron estos dos) donde existe. Si no hay suficiente estadística, entonces CI necesita condicionar lo que se llama "estadísticas auxiliares" para tener una interpretación de intervalo creíble.
probabilityislogic