Suponga que tiene una variable explicativa donde representa una coordenada dada. También tiene una variable de respuesta . Ahora, podemos combinar ambas variables como:
En este caso, simplemente elegimos y es una matriz de covarianza que describe el relación entre y . Esto solo describe el valor de e en . Como tenemos más puntos de otras ubicaciones para e , podemos describir más valores de de la siguiente manera:
Notarás que reorganizamos los componentes de y para obtener todas las en una columna y luego concatenar todas las juntas. Cada componente es una función de correlación y es como arriba. La razón tenemos la covarianza es porque suponemos que es posible separar la matriz de covarianza como .
Pregunta 1: Cuando calculo el , lo que realmente estoy haciendo es generar un conjunto de valores de basado en ¿correcto? Ya tengo por lo que estaría más interesado en predecir un nuevo punto . En este caso, debería tener una matriz definida como
en el que es un vector . Por lo tanto, podemos construir un vector (sin reorganización):
Y ahora solo reorganizo para obtener una distribución conjunta y obtenga el condicional .
¿Es esto correcto?
Pregunta 2: Para predecir, el documento que estoy leyendo indica que debo usar esta distribución condicional y obtener un posterior distribución , pero no estoy seguro de cómo obtener la distribución posterior de los parámetros. Tal vez podría usar la distribución que creo es exactamente lo mismo que y luego simplemente usa el teorema de Bayes para obtener
Pregunta 3: Al final del subcapítulo, el autor dice esto:
Para la predicción, no tenemos . Esto no crea ningún problema nuevo, ya que puede tratarse como una variable latente e incorporarse en Esto solo da como resultado un sorteo adicional dentro de cada iteración de Gibbs y es una adición trivial a la tarea computacional.
¿Qué significa ese párrafo?
Por cierto, este procedimiento se puede encontrar en este documento (página 8), pero como puede ver, necesito un poco más de detalles.
¡Gracias!
fuente
Respuestas:
Pregunta 1: Dado su modelo de probabilidad conjunta la distribución condicional de dado también es Normal, con media y matriz de varianza-covarianza
Pregunta 2: El predictivo se define como es decir, integrando los parámetros utilizando la distribución posterior de esos posteriores, dados los datos actuales . Entonces hay un poco más en la respuesta completa. Obviamente, si solo necesita simular desde el predictivo, su noción de simular conjuntamente desde y luego desde es válido.p(y(s0)∣x(s0),X,Y)
Pregunta 3: En el caso de que no se observe, el par se puede predecir a partir de otro predictivox(s0) (x(s0),y(s0))
Al simular a partir de este predictivo, ya que no está disponible en una forma manejable, se puede ejecutar una muestra de Gibbs que simule iterativamente
o bien fusionar los pasos 4 y 5 en un solo paso
fuente