¿Cuándo usar Bayesian Networks sobre otros enfoques de aprendizaje automático?

12

Espero que no haya una respuesta definitiva a esta pregunta. Pero he utilizado varios algoritmos de aprendizaje automático en el pasado y estoy tratando de aprender sobre las redes bayesianas. Me gustaría entender bajo qué circunstancia, o para qué tipo de problemas elegiría usar Bayesian Network sobre otros enfoques.

AndyC
fuente
3
Para mí, las redes bayesianas son una forma de definir las dependencias condicionales en un modelo. Una vez que haya definido eso, supongo que puede usar varias herramientas de aprendizaje para estimar los parámetros del modelo. Entonces, veo una clara separación entre el aprendizaje de parámetros y el modelo. Sin embargo, no soy un experto en esto, por lo que alguien puede obtener una mejor respuesta.
Luca

Respuestas:

7

Las redes bayesianas (BN) son modelos generativos. Suponga que tiene un conjunto de entradas, , y la salida . Los BN le permiten aprender la distribución conjunta , a diferencia de la regresión logística o la máquina de vectores de soporte, que modela la distribución condicional .Y P ( X , Y ) P ( Y | X )XYP(X,Y)P(Y|X)

Aprender la distribución de probabilidad conjunta (modelo generativo) de los datos es más difícil que aprender la probabilidad condicional (modelos discriminativos). Sin embargo, el primero proporciona un modelo más versátil donde puede ejecutar consultas como o , etc. Con el modelo discriminativo, su único objetivo es aprender .P ( X 1 | X 2 = A , X 3 = B ) P ( Y | X )P(X1|Y)P(X1|X2=A,X3=B)P(Y|X)

BN utiliza DAG para prescribir la distribución conjunta. Por lo tanto, son modelos gráficos.

Ventajas:

  1. Cuando faltan muchos datos, por ejemplo, en medicina, los BN pueden ser muy efectivos ya que modelar la distribución conjunta (es decir, su afirmación sobre cómo se generaron los datos) reduce su dependencia de tener un conjunto de datos completamente observado.

  2. Cuando desee modelar un dominio de una manera que sea visualmente transparente y también pretenda capturar las relaciones , los BN pueden ser muy poderosos. Tenga en cuenta que el supuesto de causalidad en BN está abierto a debate sin embargo.causeeffect

  3. Aprender la distribución conjunta es una tarea difícil, modelarla para variables discretas (a través del cálculo de tablas de probabilidad condicional, es decir, CPT) es sustancialmente más fácil que tratar de hacer lo mismo para las variables continuas. Por lo tanto, los BN son prácticamente más comunes con variables discretas.

  4. Los BN no solo permiten la inferencia observacional (como lo permiten todos los modelos de aprendizaje automático) sino también las intervenciones causales . Esta es una ventaja comúnmente descuidada y subestimada de los BN y está relacionada con el razonamiento contrafactual.

Zhubarb
fuente
1
En la ventaja 1 donde dice que los BN son efectivos para modelar datos con muchos valores perdidos, ¿estos valores faltantes no afectan la identificación correcta de las dependencias en los datos?
Hossein
1
Sí, mientras ajusta el modelo, aún necesitaría imputar algunos supuestos, pero una vez que tenga una estructura para, por ejemplo, , dependiendo de la factorización de su DAG (que encapsula sus supuestos de independencia), usted es posible que no necesite si ya está disponible, o viceversa. X 1 X 2P(Y,X1,X2)X1X2
Zhubarb
1

En mi experiencia, Bayesian Networks funciona muy bien cuando hay datos categóricos de alta dimensión . Proporcionan modelos interpretables, que (a veces) ayudan a entender cómo interactúan las diferentes variables.

Bronceado
fuente