¿Cuál es la relación entre modelos jerárquicos, redes neuronales, modelos gráficos, redes bayesianas?

Respuestas:

30

Una red bayesiana es un tipo de modelo gráfico. El otro tipo de modelo gráfico "grande" es un campo aleatorio de Markov (MRF). Los modelos gráficos se utilizan para inferencia, estimación y, en general, para modelar el mundo.

El término modelo jerárquico se usa para significar muchas cosas en diferentes áreas.

Si bien las redes neuronales vienen con "gráficos", generalmente no codifican información de dependencia, y los nodos no representan variables aleatorias. Las NN son diferentes porque son discriminatorias. Las redes neuronales populares se usan para clasificación y regresión.

Kevin Murphy tiene una excelente introducción a estos temas disponible aquí .

carlosdc
fuente
buen enlace thx
suncoolsu
1
Gracias por la respuesta. Sin embargo, al igual que el autor de la pregunta original, también me pregunto dónde encajan los modelos de regresión multinivel / jerárquica en esta imagen. (Jerárquico es como se define aquí: en.wikipedia.org/wiki/Hierarchical_linear_modeling )
Yang
pero también hay modelos generativos de redes neuronales. RNN, GAN, etc.
Alexander Reshytko
9

Como dijo @carlosdc , una red bayesiana es un tipo de modelo gráfico (es decir, un gráfico acíclico dirigido (DAG) cuya estructura define un conjunto de propiedades de independencia condicional). Los modelos jerárquicos de Bayes también se pueden representar como DAG; Los clasificadores jerárquicos de Bayes ingenuos para datos inciertos , de Bellazzi et al., Proporcionan una buena introducción a la clasificación con tales modelos. Acerca de los modelos jerárquicos, creo que muchos artículos se pueden recuperar buscando en Google las palabras clave apropiadas; por ejemplo, encontré este:

CH Jackson, NG Best y S. Richardson. Modelos gráficos bayesianos para la regresión en múltiples conjuntos de datos con diferentes variables . Bioestadística (2008) 10 (2): 335-351.

Michael I. Jordan tiene un buen tutorial sobre modelos gráficos , con varias aplicaciones basadas en el modelo factorial de Hidden Markov en bioinformática o procesamiento del lenguaje natural. También vale la pena leer su libro, Learning in Graphical Models (MIT Press, 1998) (hay una aplicación de GMs para el modelado estructural con código BUGS , pp. 575-598)

chl
fuente
0

Las redes neuronales no requieren antecedentes, pero cada nodo oculto (neuronas) de una red neuronal se puede considerar como CPD - Ruido OR / AND CPD para un nodo lineal - CPD sigmoide para un nodo logístico

Por lo tanto, las redes neuronales podrían verse como múltiples capas de nodos ocultos, cada una con CPD lineales / sigmoidales

La clase de Koller en Coursera O su libro de texto debería ser una buena referencia para los tipos de CPD.

Raghu
fuente
¿Qué significa CPD?
gwr