¿Cuáles son las ventajas de usar una red neuronal bayesiana?

12

Recientemente leí algunos artículos sobre la red neuronal bayesiana (BNN) [Neal, 1992] , [Neal, 2012] , que proporciona una relación de probabilidad entre la entrada y la salida en una red neuronal. La capacitación de una red neuronal de este tipo es a través de MCMC, que es diferente del algoritmo tradicional de retropropagación.

Mis preguntas son: ¿Cuál es la ventaja de usar una red tan neuronal? Más específicamente, ¿podría proporcionar algunos ejemplos que se ajusten mejor a BNN que a NN?

fishiwhj
fuente

Respuestas:

9

Las redes neuronales bayesianas son útiles para resolver problemas en dominios donde los datos son escasos, como una forma de evitar el sobreajuste. A menudo superan a todos los demás métodos en tales situaciones. Ejemplos de aplicaciones son la biología molecular ( por ejemplo, este documento ) y el diagnóstico médico (áreas donde los datos a menudo provienen de trabajos caducos y difíciles de trabajo). En realidad, las redes bayesianas son universalmente útiles y pueden obtener mejores resultados para una gran cantidad de tareas, pero son extremadamente difíciles de escalar a grandes problemas.

Denis Tarasov
fuente
2
¿Puede explicar por qué las redes bayesianas son difíciles de escalar?
Ellis Valentiner
6

Una ventaja del BNN sobre el NN es que puede calcular automáticamente un error asociado con sus predicciones al tratar con datos de objetivos desconocidos. Con un BNN, ahora estamos haciendo inferencia bayesiana. Definamos nuestra predicción BNN como , donde es la función NN, son sus entradas , son los parámetros NN, y x, t son las entradas y objetivos de entrenamiento. Esto debería ser compatible con la sintaxis utilizada por Neal en los enlaces proporcionados por @forecaster. Luego podemos calcular una desviación estándar de la distribución predictiva posterior, que ingenuamente usaría como precisión en la predicción:ff¯(x|x,t)=f(x,ω)p(ω|x,t)dωfxωσ(x)=[f(x,ω)f¯(x|x,t)]2p(ω|x,t)dω

Michelle K
fuente
1
Esta es una adición interesante a la conversación, pero es un poco corta para nuestros estándares. ¿Podría elaborar un poco y tal vez incluir una referencia?
Sycorax dice Reinstate a Monica
Seguro. Con un BNN, ahora estamos haciendo inferencia bayesiana. Definamos nuestra predicción BNN como , donde f es el NN función, x 'son sus entradas, son los parámetros NN y son las entradas y objetivos de entrenamiento. Esto debería ser compatible con la sintaxis utilizada por Neal en los enlaces proporcionados por @forecaster. Luego podemos calcular una desviación estándar de la distribución predictiva posterior, que ingenuamente usaría como precisión en la predicción:f¯(x|x,t)=f(x,ω)p(ω|x,t)dωωx,tσ(x)=([f(x,ω)f¯(x|x,t)]2p(ω|x,t)dω)
Michelle K
Edite esto en su respuesta.
Sycorax dice Reinstate Monica