¿Es irrelevante la dirección de los bordes en una red Bayes?

10

Hoy, en una conferencia, se afirmó que la dirección de los bordes en una red Bayes realmente no importa. No tienen que representar la causalidad.

Es obvio que no puede cambiar ningún borde en una red Bayes. Por ejemplo, deje que con y . Si cambiara a , entonces ya no sería acíclico y, por lo tanto, no sería una red Bayes. Esto parece ser principalmente un problema práctico sobre cómo estimar las probabilidades entonces. Este caso parece ser mucho más difícil de responder, por lo que lo omitiré.V = { v 1 , v 2 , v 3 } E = { ( v 1 , v 2 ) , ( v 1 , v 3 ) , ( v 2 , v 3 ) } ( v 1 , v 3 ) ( v 3 , v 1 ) GG=(V,E)V={v1,v2,v3}E={(v1,v2),(v1,v3),(v2,v3)}(v1,v3)(v3,v1)G

Esto me hizo hacer las siguientes preguntas para las cuales espero obtener respuestas aquí:

  1. ¿Es posible que cualquier gráfico acíclico dirigido (DAG) invierta todos los bordes y aún tenga un DAG?
  2. Suponga un DAG y se proporcionan datos. Ahora construimos el DAG inverso . Para ambos DAG, ajustamos los datos a las redes Bayes correspondientes. Ahora tenemos un conjunto de datos para los que queremos usar la red Bayes para predecir los atributos que faltan. ¿Podría haber resultados diferentes para ambos DAG? (Bonificación si se te ocurre un ejemplo)G invGGinv
  3. Similar a 2, pero más simple: suponga un DAG y se proporcionan datos. Puede crear un nuevo gráfico invirtiendo cualquier conjunto de bordes, siempre que permanezca acíclico. ¿Son equivalentes las redes de Bayes cuando se trata de sus predicciones?G G GGG
  4. ¿Obtenemos algo si tenemos bordes que representan causalidad?
Martin Thoma
fuente

Respuestas:

6

TL; DR: a veces puedes hacer una red bayesiana equivalente invirtiendo flechas, y a veces no puedes.

Simplemente invertir la dirección de las flechas produce otro gráfico dirigido, pero ese gráfico no es necesariamente el gráfico de una red bayesiana equivalente, porque las relaciones de dependencia representadas por el gráfico de flecha invertida pueden ser diferentes de las representadas por el gráfico original. Si el gráfico de flecha invertida representa diferentes relaciones de dependencia que el original, en algunos casos es posible crear una red bayesiana equivalente agregando algunas flechas más para capturar las relaciones de dependencia que faltan en el gráfico de flecha invertida. Pero en algunos casos no hay una red bayesiana exactamente equivalente. Si tiene que agregar algunas flechas para capturar dependencias,

Por ejemplo, a -> b -> crepresenta las mismas dependencias e independencias que a <- b <- c, y lo mismo que a <- b -> c, pero no lo mismo que a -> b <- c. Este último gráfico dice que ay cson independientes si bno se observa, pero a <- b -> cdice ay cson dependientes en ese caso. Podemos agregar un borde directamente desde aa cpara capturar eso, pero entonces ay cser independiente cuando bse observa no se representa. Eso significa que hay al menos una factorización que no podemos explotar al calcular las probabilidades posteriores.

Todo esto sobre dependencia / independencia, flechas y sus reversiones, etc., está cubierto en textos estándar sobre redes bayesianas. Puedo desenterrar algunas referencias si quieres.

Las redes bayesianas no expresan causalidad. Judea Pearl, que trabajó mucho en redes bayesianas, también ha trabajado en lo que él llama redes causales (esencialmente redes bayesianas anotadas con relaciones causales).

Robert Dodier
fuente
Esto responde las preguntas (2) y (3). ¿Tienes una idea sobre las preguntas (1) y (4) también? (Sí, las referencias serían buenas)
Martin Thoma
(1) Considere la contrapositiva: si el gráfico de flecha invertida tiene un ciclo dirigido, entonces seguir las flechas alrededor del ciclo hacia atrás debe ser un ciclo dirigido en el gráfico original. (4) Las redes bayesianas son modelos probabilísticos y, como tales, no representan causalidad. Es posible que algunas flechas realmente se refieran a relaciones causales, pero esto se pierde en un modelo probabilístico. Quizás acausas b, pero a -> by a <- bson modelos probabilísticos igualmente válidos.
Robert Dodier
Algunas referencias introductorias. Koller y Friedman: "Modelos gráficos probabilísticos". Cowell, Dawid, Lauritzen y Spiegelhalter: "Redes probabilísticas y sistemas expertos". Castillo, Gutiérrez y Hadi: "Sistemas expertos y modelos de red probabilísticos".
Robert Dodier
Puede invertir cualquier flecha y obtener una Red Bayesiana equivalente siempre que mantenga las estructuras en V (no invierta una flecha que otra flecha también esté apuntando al nodo al que apunta)
borgr
1

Esto puede ser un poco insatisfactorio, así que siéntase libre de no aceptar esta respuesta y disculpas de antemano.

En una red Bayes, los nodos representan variables aleatorias y los bordes representan dependencias condicionales. Cuando interpretas los nodos de cierta manera, el condicionamiento fluye de una manera natural. Invertirlos arbitrariamente no tiene sentido en el contexto de los datos de modelado. Y mucho tiempo, las flechas representan causalidad.

Taylor
fuente
1
Esto está bastante lejos de la marca. La interpretación "natural" es algo impuesto al modelo, no es parte del modelo en sí. Puede revertir las dependencias (agregando bordes adicionales según sea necesario para preservar el conjunto de dependencias representadas por la red) y sigue siendo una red bayesiana. Si tiene sentido no se puede responder examinando solo la red misma. Por cierto, Judea Pearl, una de las grandes impulsoras de las redes bayesianas en los años 80 y 90, ha estado trabajando más recientemente en modelos formales de causalidad, que expresan relaciones causales en el modelo.
Robert Dodier
Usted dice, "si tiene sentido no se puede responder examinando solo la red misma". Yo nunca dije que era. Dije "cuando interpretas los nodos de cierta manera, el condicionamiento fluye de cierta manera ..." Esto probablemente refleja mi sesgo; puedes llamar a las cosas que trabajo en una red bayes, pero esta pregunta nunca se me ocurriría. Por ejemplo, si dos nodos representan la misma variable en diferentes momentos, no habría dudas sobre en qué dirección fluye el condicionamiento. Sin embargo, acepto la posibilidad de que haya situaciones en las que las personas puedan usar estas redes de Baye de una manera menos rígida.
Taylor
0

Pregunta 3

synergy.st-andrews.ac.uk/vannesmithlab afirma que los gráficos

G1 = o->o->o and
G2 = o<-o->o

están en una clase de equivalencia. Según esa fuente, los modelos representan exactamente la misma distribución de probabilidad conjunta.

Martin Thoma
fuente
Eso no puede estar bien. Para G1, el primero y el último dependen de la ausencia de valores conocidos. Para G2, el primero y el último no dependen de la ausencia de valores conocidos. ¿Querías escribir en su G2 = o <- o -> olugar? De todos modos, no veo un reclamo sobre esos gráficos particulares en la página web a los que ha hecho referencia; Quizás puedas ser más específico.
Robert Dodier