Todos parecen representar variables aleatorias por los nodos y (in) dependencia a través de los bordes (posiblemente dirigidos). Estoy especialmente interesado en el punto de vista de un bayesiano.
34
Todos parecen representar variables aleatorias por los nodos y (in) dependencia a través de los bordes (posiblemente dirigidos). Estoy especialmente interesado en el punto de vista de un bayesiano.
Una red bayesiana es un tipo de modelo gráfico. El otro tipo de modelo gráfico "grande" es un campo aleatorio de Markov (MRF). Los modelos gráficos se utilizan para inferencia, estimación y, en general, para modelar el mundo.
El término modelo jerárquico se usa para significar muchas cosas en diferentes áreas.
Si bien las redes neuronales vienen con "gráficos", generalmente no codifican información de dependencia, y los nodos no representan variables aleatorias. Las NN son diferentes porque son discriminatorias. Las redes neuronales populares se usan para clasificación y regresión.
Kevin Murphy tiene una excelente introducción a estos temas disponible aquí .
Como dijo @carlosdc , una red bayesiana es un tipo de modelo gráfico (es decir, un gráfico acíclico dirigido (DAG) cuya estructura define un conjunto de propiedades de independencia condicional). Los modelos jerárquicos de Bayes también se pueden representar como DAG; Los clasificadores jerárquicos de Bayes ingenuos para datos inciertos , de Bellazzi et al., Proporcionan una buena introducción a la clasificación con tales modelos. Acerca de los modelos jerárquicos, creo que muchos artículos se pueden recuperar buscando en Google las palabras clave apropiadas; por ejemplo, encontré este:
Michael I. Jordan tiene un buen tutorial sobre modelos gráficos , con varias aplicaciones basadas en el modelo factorial de Hidden Markov en bioinformática o procesamiento del lenguaje natural. También vale la pena leer su libro, Learning in Graphical Models (MIT Press, 1998) (hay una aplicación de GMs para el modelado estructural con código BUGS , pp. 575-598)
fuente
Las redes neuronales no requieren antecedentes, pero cada nodo oculto (neuronas) de una red neuronal se puede considerar como CPD - Ruido OR / AND CPD para un nodo lineal - CPD sigmoide para un nodo logístico
Por lo tanto, las redes neuronales podrían verse como múltiples capas de nodos ocultos, cada una con CPD lineales / sigmoidales
La clase de Koller en Coursera O su libro de texto debería ser una buena referencia para los tipos de CPD.
fuente