¿Por qué usar el gráfico de factores para la inferencia bayesiana?

10

No entiendo por qué convertir una red bayesiana en un gráfico de factores es bueno para la inferencia bayesiana.

Mis preguntas son:

  1. ¿Cuál es el beneficio de usar el factor gráfico en el razonamiento bayesiano?
  2. ¿Qué pasaría si no lo usamos?

Cualquier ejemplo concreto será apreciado!

xiaohan2012
fuente

Respuestas:

5

Trataré de responder mi propia pregunta.

Mensaje

Una noción muy importante del factor gráfico es el mensaje , que se puede entender cuando A dice algo sobre B, si el mensaje se pasa de A a B.

En el contexto del modelo probabilístico, mensaje del factor f a variable x se puede denotar como μfx, que puede entenderse como f sabe algo (distribución de probabilidad en este caso) y le dice que x.

Factor resume mensajes

En el contexto del "factor", para conocer la distribución de probabilidad de alguna variable, uno necesita tener todos los mensajes listos de sus factores vecinos y luego resumir todos los mensajes para derivar la distribución.

Por ejemplo, en el siguiente gráfico, los bordes, xi, son variables y nodos, fi, son factores conectados por aristas.

Gráfico de factor de ejemplo

Saber P(x4), necesitamos saber el μf3x4 y μf4x4 y resumirlos juntos.

Estructura recursiva de mensajes.

Entonces, ¿cómo saber estos dos mensajes? Por ejemplo,μf4x4. Puede verse como el mensaje después de resumir dos mensajes,μx5f4 y μx6f4. Yμx6f4 Es esencial μf6x6, que se puede calcular a partir de otros mensajes.

Esta es la estructura recursiva de los mensajes, los mensajes pueden definirse por mensajes .

La recursión es algo bueno, uno para una mejor comprensión, otro para una implementación más fácil del programa de computadora.

Conclusión

Los beneficios de los factores son:

  1. Factor, que resume los mensajes de entrada y genera el mensaje de salida, habilita los mensajes que son esenciales para la computación marginal.
  2. Los factores permiten la estructura recursiva de cálculo de mensajes, lo que hace que el proceso de propagación de creencias o transmisión de mensajes sea ​​más fácil de entender y posiblemente más fácil de implementar.
xiaohan2012
fuente
1

Una red bayesiana, por definición, es una colección de variables aleatorias {Xn:PR} y un gráfico G tal que la función de probabilidad P(X1,...,Xn) factores como probabilidades condicionales de una manera determinada por G. Ver http://en.wikipedia.org/wiki/Factor_graph .

Lo más importante es que los factores en la Red Bayesiana son de la forma P(Xi|Xj1,..,Xjn).

Un gráfico de factores, aunque es más general, es el mismo ya que es una forma gráfica de mantener información sobre la factorización de P(X1,...,Xn) o cualquier otra función.

La diferencia es que cuando una red bayesiana se convierte en un gráfico de factores, los factores en el gráfico de factores se agrupan. Por ejemplo, un factor en el gráfico de factores puede serP(Xi|Xj1,..,Xjn)P(Xjn)P(Xj1)=P(Xi|Xj2,..,Xjn1). La red bayesiana original almacenó esto como tres factores, pero el gráfico de factores lo almacena solo como un factor. En general, el gráfico de factores de una red bayesiana hace un seguimiento de menos factorizaciones que la red bayesiana original.

SomeEE
fuente