Modelado bayesiano usando normal multivariante con covariable

11

Suponga que tiene una variable explicativa donde representa una coordenada dada. También tiene una variable de respuesta . Ahora, podemos combinar ambas variables como:X=(X(s1),,X(sn))sY=(Y(s1),,Y(sn))

W(s)=(X(s)Y(s))N(μ(s),T)

En este caso, simplemente elegimos μ(s)=(μ1μ2)T y T es una matriz de covarianza que describe el relación entre X y Y . Esto solo describe el valor de X e Y en s . Como tenemos más puntos de otras ubicaciones para X e Y , podemos describir más valores de W(s) de la siguiente manera:

(XY)=N((μ11μ21),TH(ϕ))

Notarás que reorganizamos los componentes de X y Y para obtener todas las X(si) en una columna y luego concatenar todas las Y(si) juntas. Cada componente H(ϕ)ij es una función de correlación ρ(si,sj) y T es como arriba. La razón tenemos la covarianza TH(ϕ) es porque suponemos que es posible separar la matriz de covarianza como C(s,s)=ρ(s,s)T .

Pregunta 1: Cuando calculo el YX , lo que realmente estoy haciendo es generar un conjunto de valores de Y basado en X ¿correcto? Ya tengo Y por lo que estaría más interesado en predecir un nuevo punto y(s0) . En este caso, debería tener una matriz H(ϕ) definida como

H(ϕ)=(H(ϕ)hhρ(0,ϕ))

en el que h(ϕ) es un vector ρ(s0sj;ϕ) . Por lo tanto, podemos construir un vector (sin reorganización):

W=(W(s1),,W(sn),W(s0))TN(1n+1(μ1μ2),H(ϕ)T)

Y ahora solo reorganizo para obtener una distribución conjunta y obtenga el condicional .(Xx(s0)Yy(s0))p(y(s0)x0,X,Y)

¿Es esto correcto?

Pregunta 2: Para predecir, el documento que estoy leyendo indica que debo usar esta distribución condicional y obtener un posterior distribución , pero no estoy seguro de cómo obtener la distribución posterior de los parámetros. Tal vez podría usar la distribución que creo es exactamente lo mismo que y luego simplemente usa el teorema de Bayes para obtenerp(y(s0)x0,X,Y)p(μ,T,ϕx(s0),Y,X)(Xx(s0)Y)p(X,x(s0),Yμ,T,ϕ)p(μ,T,ϕX,x(s0),Y)p(X,x(s0),Yμ,T,ϕ)p(μ,T,ϕ)

Pregunta 3: Al final del subcapítulo, el autor dice esto:

Para la predicción, no tenemos . Esto no crea ningún problema nuevo, ya que puede tratarse como una variable latente e incorporarse en Esto solo da como resultado un sorteo adicional dentro de cada iteración de Gibbs y es una adición trivial a la tarea computacional.X(s0)x

¿Qué significa ese párrafo?

Por cierto, este procedimiento se puede encontrar en este documento (página 8), pero como puede ver, necesito un poco más de detalles.

¡Gracias!

Robert Smith
fuente
Votado para migrar por solicitud de OP .
Diría que es correcto para ambas respuestas a las preguntas 1 y 2. La pregunta 3 significa que la no observada se trata como un parámetro adicional, además de , usando el condicional completo como anteriormente en . X(s0)μ,T,ϕ
p(x(s0)X,,Y,μ,T,ϕ)
X(s0)
Xi'an

Respuestas:

2

Pregunta 1: Dado su modelo de probabilidad conjunta la distribución condicional de dado también es Normal, con media y matriz de varianza-covarianza

(XY)N((μ11μ21),[Σ11Σ12Σ21Σ22])=N((μ11μ21),TH(ϕ))
YX
μ2+Σ21Σ111(Xμ1)
Σ22Σ21Σ111Σ21.
(Esas fórmulas se copian textualmente de la página de Wikipedia en normales multivariadas ). Lo mismo se aplica a desde es otro vector normal.p(y(s0)x(s0),X,Y)(y(s0),x(s0),X,Y)

Pregunta 2: El predictivo se define como es decir, integrando los parámetros utilizando la distribución posterior de esos posteriores, dados los datos actuales . Entonces hay un poco más en la respuesta completa. Obviamente, si solo necesita simular desde el predictivo, su noción de simular conjuntamente desde y luego desde es válido.p(y(s0)x(s0),X,Y)

p(y(s0)|x(s0),X,Y)=p(y(s0)|x(s0),X,Y,μ,T,ϕ)p(μ,T,ϕ|x(s0),X,Y)dμdTdϕ,
(X,Y,x(s0))p(μ,T,ϕX,x(s0),Y)p(y(s0)x(s0),X,Y,μ,T,ϕ)

Pregunta 3: En el caso de que no se observe, el par se puede predecir a partir de otro predictivo x(s0)(x(s0),y(s0))

p(x(s0),y(s0)X,Y)=p(x(s0),y(s0)X,Y,μ,T,ϕ)p(μ,T,ϕX,Y)dμdTdϕ.

Al simular a partir de este predictivo, ya que no está disponible en una forma manejable, se puede ejecutar una muestra de Gibbs que simule iterativamente

  1. μX,Y,x(s0),y(s0),T,ϕ
  2. TX,Y,x(s0),y(s0),μ,ϕ
  3. ϕX,Y,x(s0),y(s0),T,μ
  4. x(s0)X,Y,y(s0),ϕ,T,μ
  5. y(s0)X,Y,x(s0),ϕ,T,μ

o bien fusionar los pasos 4 y 5 en un solo paso

  • x(s0),y(s0)X,Y,ϕ,T,μ
Xi'an
fuente