¿Cómo completo el cuadrado desde el punto donde lo dejé y es correcto hasta ahora?
Tengo un previo normal para de la forma , Llegar:
dónde es .
Mi probabilidad tiene una distribución normal para los puntos de datos y de la forma
(Tenga en cuenta que es una matriz / vector, \ bf no funciona).
Para obtener mi posterior para , combiné lo anterior, tomé solo las partes exponenciales y luego me expandí para obtener:
.
Eliminé el término , ya que no es una función de .
Poniendo en una expresión sin el exponencial:
.
Sé que necesito combinar los términos similares y adoptar la forma de la distribución normal multivariante, que es a lo que apunto, pero no estoy seguro de cómo hacerlo. ¿Probablemente tengo que agregar un término adicional a la expresión para que tenga la forma correcta?
Nota: Esto no es tarea, es un proyecto, pero mi conocimiento de trabajo bayesiano no es bueno en absoluto y, por lo tanto, necesito entender el trabajo. Tengo la intención de integrar el y luego el después de entrar en la forma multivariante.
Respuestas:
Comenzaré desde cero, ya que la publicación original tiene algunos errores tipográficos matemáticos como signos incorrectos, dejando caer elV matriz, etc.
Has especificado antesp(β)=N(0,σ2V) y probabilidad: p(y|β)=N(Bβ,σ2I) .
Podemos escribir cada uno de estos simplemente como expresiones de términos dentro delexp eso depende de β , agrupando todos los términos no relacionados con β en una sola constante:
Agregado estos en el espacio de registro y la recopilación de términos similares produce el registro posterior no normalizado
... aquí, hemos usado la identidad estándarxTAx+xTCx=xT(A+C)x para cualquier vector x y matrices A,C de tamaño apropiado.
OK, nuestro objetivo ahora es "completar" el cuadrado. Nos gustaría una expresión de la siguiente forma, lo que indicaría que la posterior paraβ es gaussiano
donde los parámetrosμp,Λp definir la media posterior y la matriz de covarianza inversa respectivamente.
Bueno, por inspección eqn. (1) se parece mucho a este formulario si configuramos
En detalle, podemos mostrar que esta sustitución crea cada término necesario a partir de (1):
término cuadrático:βTΛpβ=βT(V−1+BTB)β
término lineal:μTpΛpβ=(Λ−1pBTy)TΛpβ=yTBΛ−1pΛpβ=yTBβ
.... aquí usamos hechos(AB)T=BTAT y (Λ−1p)T=Λ−1p debido a la simetría (Λp es simétrica, entonces también lo es su inverso).
Sin embargo, esto nos deja con un término extra molestoμTpΛpμp . Para evitar esto, solo restamos este término de nuestro resultado final. Por lo tanto, podemos sustituir directamente nuestroμp,Λp parámetros en (1) para obtener
ya que ese último término es constante con respecto aβ , podemos simplemente convertirlo en la gran constante de normalización en el lado izquierdo y hemos logrado nuestro objetivo.
fuente