¿Hay algún dominio donde Bayesian Networks supere a las redes neuronales?

48

Las redes neuronales obtienen los mejores resultados en tareas de visión por computadora (ver MNIST , ILSVRC , Kaggle Galaxy Challenge ). Parecen superar a cualquier otro enfoque en Computer Vision. Pero también hay otras tareas:

Desafío de actividad molecular de Kaggle
Regresión: predicción de Kaggle Rain , también el segundo lugar
Agarre y 2º Ascensor también el tercer lugar - Identificar los movimientos de las manos de los registros de EEG

No estoy muy seguro sobre ASR (reconocimiento automático de voz) y la traducción automática, pero creo que también he escuchado que las redes neuronales (recurrentes) (comienzan a) superan a otros enfoques.

Actualmente estoy aprendiendo sobre las redes bayesianas y me pregunto en qué casos se aplican generalmente esos modelos. Entonces mi pregunta es:

¿Existe algún desafío / competencia (Kaggle), donde el estado del arte son las redes bayesianas o al menos modelos muy similares?

(Nota al margen: también he visto árboles de decisión , 2 , 3 , 4 , 5 , 6 , 7 victorias en varios desafíos recientes de Kaggle)

machine-learning pgm Martin Thoma
fuente

No es una cuestión de dominio. Se trata de cuántos datos tiene, qué tan buenos son sus antecedentes y si desea posteriores.

Emre

1

@Emre, que es una cuestión de dominio ... (y, por supuesto, de dinero cuando tienes la posibilidad de no solo usar los conjuntos de datos existentes, sino también contratar personas para crear / etiquetar nuevos datos).

Martin Thoma el

Sería una cuestión de dominio si hubiera alguna propiedad de los datos, alguna estructura, que un algoritmo aprovechara mejor que el otro, pero eso no es lo que sugiero.

Emre

2

Así que la respuesta a su pregunta es entonces, n . ¿Derecho? Debido a que todas las respuestas parecen apuntar las ventajas de Bayesian Networks sobre otros modelos predictivos, pero no he visto ninguna competencia de Kaggle donde realmente superen a otros modelos. ¿Alguien puede proporcionar uno? Porque todas las razones y posibles ventajas, por ejemplo, la falta de datos suficientes y la elección de buenos antecedentes, dadas en las respuestas, parecen excelentes en teoría, pero aún no responden la pregunta proporcionando, al menos, un ejemplo.

MNLR

Una cosa es que las redes bayesianas pueden ser útiles para tareas / aprendizaje no supervisados donde la cantidad de datos es relativamente limitada. Las redes neuronales solo superan a otras cuando hay una gran cantidad de datos para ser entrenados.

xji

31

Una de las áreas donde a menudo se utilizan enfoques bayesianos, es donde uno necesita la capacidad de interpretación del sistema de predicción. No desea dar a los médicos una red neuronal y decir que es 95% precisa. Prefiere explicar las suposiciones que hace su método, así como el proceso de decisión que utiliza el método.

Un área similar es cuando tienes un conocimiento previo de dominio fuerte y quieres usarlo en el sistema.

MLgeek
fuente

1

Ver también: El mito de la interpretabilidad del modelo

Martin Thoma

Ver también: lima

Martin Thoma

18

Las redes bayesianas y las redes neuronales no son exclusivas entre sí. De hecho, las redes bayesianas son solo otro término para "modelo gráfico dirigido". Pueden ser muy útiles en el diseño de funciones objetivas de redes neuronales. Yann Lecun ha señalado esto aquí: https://plus.google.com/+YannLeCunPhD/posts/gWE7Jca3Zoq .

Un ejemplo.

El codificador automático variacional y las derivadas son modelos gráficos dirigidos de la forma Se utiliza una red neuronal para implementar y una aproximación a su inverso: .

pags (X) = \int_{z} pags (X El | z) pags (z) re z .

$p(x) = \int_z p(x|z)p(z) dz.$

p (x | z)

$p(x|z)$

q (z | x) \approx p (z | x)

$q(z|x) \approx p(z|x)$

bayer
fuente

¿Pueden las dos partes ser entrenadas conjuntamente?

nn0p

16

Excelentes respuestas ya.

Un dominio en el que puedo pensar, y en el que estoy trabajando extensamente, es el dominio de análisis de clientes .

Tengo que comprender y predecir los movimientos y los motivos de los clientes para informar y advertir tanto a la atención al cliente, el marketing y también a los equipos de crecimiento.

Entonces, aquí, las redes neuronales hacen un muy buen trabajo en la predicción de abandono, etc. Pero, encontré y prefiero el estilo de redes bayesianas, y aquí están las razones para preferirlo:

Los clientes siempre tienen un patrón. Siempre tienen una razón para actuar. Y esa razón sería algo que mi equipo ha hecho por ellos, o ellos mismos han aprendido. Entonces, todo tiene un previo aquí, y de hecho esa razón es muy importante ya que alimenta la mayor parte de la decisión tomada por el cliente.
Cada movimiento del cliente y los equipos de crecimiento en el embudo de marketing / ventas es causa-efecto. Por lo tanto, el conocimiento previo es vital cuando se trata de convertir un posible cliente potencial en un cliente.

Entonces, el concepto de prior es muy importante cuando se trata de análisis de clientes, lo que hace que el concepto de redes bayesianas sea muy importante para este dominio.

Aprendizaje sugerido:

Métodos Bayesianos para Redes Neuronales

Redes bayesianas en analítica empresarial

Dawny33
fuente

15

A veces te importa tanto cambiar el resultado como predecir el resultado.

Una red neuronal con suficientes datos de entrenamiento tenderá a predecir mejor el resultado, pero una vez que pueda predecir el resultado, es posible que desee predecir el efecto de realizar cambios en las características de entrada en el resultado.

Un ejemplo de la vida real es saber que es probable que alguien tenga un ataque cardíaco, pero poder decirle a la persona que si dejara de hacer XX, el riesgo se reduciría en un 30% es un beneficio mucho mayor.

Del mismo modo para la retención de clientes, saber por qué los clientes dejan de comprar con usted vale tanto como predecir los clientes que probablemente dejarán de comprar con usted.

También una Red Bayesiana más simple que predice menos bien pero que lleva a tomar más medidas a menudo puede ser mejor que una Red Bayesiana más "correcta".

La mayor ventaja de las redes bayesianas sobre las redes neuronales es que pueden usarse para inferencia causal. Esta rama es de fundamental importancia para las estadísticas y el aprendizaje automático y Judea Pearl ha ganado el premio Turing por esta investigación.

Ian Ringrose
fuente

Pero las redes neuronales también se pueden usar para determinar el papel y la importancia de las diferentes características, ¿verdad?

Hossein

7

Las redes bayesianas pueden superar a las redes neuronales en entornos de datos pequeños. Si la información previa se gestiona adecuadamente a través de la estructura de la red, los antecedentes y otros hiperparámetros, podría tener una ventaja sobre las redes neuronales. Las redes neuronales, especialmente las que tienen más capas, son muy conocidas por tener hambre de datos. Casi por definición, se necesitan muchos datos para capacitarlos adecuadamente.

Vladislavs Dovgalecs
fuente

4

Publiqué este enlace en Reddit y recibí muchos comentarios. Algunos han publicado sus respuestas aquí, otros no. Esta respuesta debería sumar la publicación de reddit. (Lo hice wiki comunitario, para no obtener puntos por ello)

Bayes variacionales de codificación automática es una combinación de una red Bayes y una red neuronal. El artículo Redes neuronales convolucionales bayesianas con inferencia variacional aproximada de Bernoulli parece ir en la misma dirección.
Abandono: una forma simple de evitar que las redes neuronales se sobreajusten es un ejemplo en el que las redes neuronales bayesianas superan su enfoque de abandono (ver sección 6.4 "Comparación con las redes neuronales bayesianas")
El aprendizaje de conceptos a nivel humano a través de la inducción del programa probabilístico es un documento "sobre una red de red bayesiana que hace una clasificación de una sola vez que superó a las redes neuronales" (de acuerdo con trashacount12345 - hasta ahora no lo había verificado).
Yann LeCun escribió una publicación de Google+ en la que argumenta que las redes neuronales y los modelos gráficos probabilísticos no son conceptos ortogonales.

2 revs
fuente

2

Las redes bayesianas son preferidas para la interpretación del genoma. Ver, por ejemplo, esta disertación sobre métodos computacionales para la interpretación del genoma.

Nathaniel Hendrix
fuente

2

¿Por qué son preferidos?

Ian Ringrose el

2

Hice un pequeño ejemplo para esto una vez. A partir de eso, creo que se prefieren las redes bayesianas si desea capturar una distribución, pero su conjunto de entrenamiento de entrada no cubre bien la distribución. En tales casos, incluso una red neuronal que se generalizara bien no podría reconstruir la distribución.

Leela Prabhu
fuente

-3

No estoy totalmente de acuerdo en que las redes neuronales funcionen bien, entonces otros estudiantes. De hecho, las redes neuronales funcionan bastante mal en comparación con otros métodos. Tampoco existe una metodología a pesar de algunos consejos sobre la elección de parámetros que este hecho se hace muy a menudo por casualidad. También hay algunos tipos que hablan al azar en los foros sobre cómo las redes neuronales son tan buenas, no porque tengan alguna evidencia al respecto, sino porque les atrae la palabra elegante y de moda, neural ''. También son muy inestables, ¿probaste una red neuronal para compararla con xgboost? No intentaré ninguna red neuronal hasta que sea autoconsciente. Así que hasta entonces feliz red neuronal :)

gm1
fuente

3

Esto es demasiado vago y conversacional para dar una buena respuesta. Algunos detalles, hechos y edición lo mejorarían.

Sean Owen el

Las personas que publican mensajes como ese dicen que las redes neuronales son las mejores, no se puede decir que las redes neuronales están funcionando bien solo porque suenan elegantes, también hay conjuntos de datos en los que las redes neuronales probablemente lo hagan. malo de tal manera que los knn están obteniendo resultados mucho mejores.

gm1

1

Si bien no niego sus puntos de vista, tampoco debería decir que su respuesta realmente no responde la pregunta. Entonces, por favor considere agregarlo como un comentario. Y, por favor, agregue cualquier pruebas concretas y la teoría que apoya su respuesta, de lo contrario podría ser considerado como una queja, por los espectadores futuros :)

Dawny33

1

@ gm1 Supongo que te referías a mí con ",, hechos específicos '' deberían ser especificados por personas que publican mensajes como ese que dicen que las redes neuronales son las mejores". Tenga en cuenta que no escribí una declaración que fuera tan general. Escribí que NN gana en muchas competencias / tareas de CV. Y he agregado un par de desafíos en los que los enfoques de redes neuronales ganaron.

Martin Thoma

Hola, hay, por supuesto, algunas competiciones de Kaggle en las que las redes neuronales funcionaron bien (suponiendo que no usaran redes neuronales combinadas con otros modelos), pero esta es una pequeña proporción de todas las competiciones de kaggle, ¿podrías usar una red neuronal para ir? ¿TOP 3 en kaggle TFI? Creo que puedo hacerlo tanto para LB público como privado con un modelo que no es lineal.

gm1

¿Hay algún dominio donde Bayesian Networks supere a las redes neuronales?

Respuestas: