Interpretación del intervalo de predicción del 95% bayesiano

9

Suponga el siguiente modelo de regresión bivariado:

yyo=βXyo+tuyo,
dónde tuyo es iid norte(0 0,σ2=9 9) para yo=1,...,norte.

Suponga un previo informativo , entonces se puede demostrar que el pdf posterior para es dondepags(β)constanteβ

pags(βEl |y)=(18 añosπ)-12(yo=1norteXyo2)12Exp[-118 añosyo=1norteXyo2(β-β^)2],
β^=(yo=1norteyyoXyo)/ /(yo=1norteXyo2).

Ahora considere el valor de con un valor futuro dado de , : donde es iid , entonces podemos mostrar que es una densidad normal con expectativa y varianza Por lo tanto, la función de densidad de probabilidad posterior para , condicional enyXXnorte+1

ynorte+1=βXnorte+1+tunorte+1,
tunorte+1norte(0 0,σ2=9 9)
pags(ynorte+1El |Xnorte+1,y)=βpags(ynorte+1El |Xnorte+1,β,y)pags(βEl |y)reβ
mi[ynorte+1El |Xnorte+1,y]=β^Xnorte+1,vunar[ynorte+1El |Xnorte+1,y]=9 9[Xnorte+12+yo=1norteXyo2]yo=1norteXyo2.
yn+1xn+1, es
p(yn+1|xn+1,y)=(18π[xn+12+i=1nxi2]i=1nxi2)12×exp{i=1nxi218(xn+12+i=1nxi2)(yn+1β^xn+1)2}

Ahora la pregunta es: especifique un intervalo de predicción del 95% para e interprete cuidadosamente. ¿Sobre qué aspecto (s) del proceso de generación de datos el intervalo no puede acomodar nuestra incertidumbre?yn+1


No estoy muy seguro de cómo responder la pregunta, pero aquí está mi intento:

Entonces, esencialmente necesitamos encontrar algunos y tales queabP(a<yn+1<b)=abp(yn+1|xn+1,y)dyn+1=95%

Ahora sabemos que donde y , por lo tanto: yn+1|xn+1,yN(m,v2)m=E[yn+1|xn+1,y]v2=var[yn+1|xn+1,y]

yn+1mvN(0,1)
PAGS(-1,96<ynorte+1-metrov<1,96)=95%
PAGS(-1,96v+metro<ynorte+1<1,96v+metro)=95%

Ahora, como estamos condicionando a y observamos la expresión para y , vemos que tanto como son valores conocidos. Así que podemos tomar y . es decir, podemos seleccionar muchas otras posibilidades de y que producen una probabilidad del ... pero ¿cómo se relaciona esto con la respuesta a la parte de la pregunta que pregunta qué aspectos del proceso de generación de datos no puede acomodar este intervalo?Xnorte+1vmetrovmetrouna=-1,96v+metrosi=1,96v+metrounasi95%

TeTs
fuente
1
Agregue la etiqueta autoestudio si esto es tarea o un intento de un problema de libro de texto.
Nick Cox
2
@Nick Cox Gracias por informarme, agregué la etiqueta de autoestudio.
TeTs
¿Podría ser que el intervalo específicamente no nos da ninguna comprensión sobre la forma del proceso de generación de datos? Es decir, ¿no sabemos la combinación media / varianza solo del intervalo?
Extraña pregunta. ¿Hay un contexto previo al ejercicio? ¿Por qué dices un modelo de regresión bivariante ?
Stéphane Laurent

Respuestas:

2

El intervalo acomoda toda la incertidumbre en el problema. En su descripción del problema, las únicas cosas que no sabe sonβ y tu. El intervalo de predicción que dedujo acomoda la incertidumbre en ambos. Por lo tanto, no queda incertidumbre para que el intervalo "no se acomode".

Tom Minka
fuente
Sigue habiendo incertidumbre sobre si el modelo es correcto o no.
Xi'an
1
El modelo fue declarado como una suposición. Por lo tanto, no hay incertidumbre al respecto.
Tom Minka
Supongo que lo que se quiere decir es que la distribución predictiva representa toda la incertidumbre en el problema y el intervalo solo resume algunos aspectos de esa distribución. Aún así, no está claro que, como intervalo, deje algo fuera.
conjugateprior