Modelos de ecuaciones estructurales (SEM) versus redes bayesianas (BN)

19

La terminología aquí es un desastre. La "ecuación estructural" es tan vaga como el "puente arquitectónico" y la "red bayesiana" no es intrínsecamente bayesiana . Aún mejor, Dios de la causalidad, Judea Pearl dice que las dos escuelas de modelos son casi idénticas.

Entonces, ¿cuáles son las diferencias importantes?

(Increíble para mí, la página de Wikipedia para SEM ni siquiera incluye la palabra "red" al momento de escribir esto).

zkurtz
fuente
He aquí una breve explicación de sí mismo Judea Pearl: causality.cs.ucla.edu/blog/index.php/2012/12/07/...
DMP
@dmp, gracias, esa parece ser la nueva versión de mi enlace roto anteriormente en 'Judea Pearl' - corregido
zkurtz

Respuestas:

11

Por lo que puedo decir, Bayesian Networks no pretende ser capaz de estimar los efectos causales en gráficos acíclicos no dirigidos, mientras que SEM sí. Esa es una generalización a favor de SEM ... si lo crees.

Un ejemplo de esto podría ser medir el deterioro cognitivo entre las personas donde la cognición es un efecto latente estimado utilizando un instrumento de encuesta como 3MSE, pero algunas personas pueden disminuir la cognición en función del uso de medicamentos para el dolor. Sus medicamentos para el dolor pueden haber sido una consecuencia de lesionarse a sí mismos debido al deterioro cognitivo (caída, por ejemplo). Y así, en un análisis de sección transversal, vería un gráfico que tiene una forma circular. A los analistas de SEM les gusta abordar problemas como ese. Me mantengo alejado.

En el mundo de la red Bayes, tiene métodos muy generales para evaluar la independencia / dependencia condicional de los nodos. Se puede usar un enfoque totalmente paramétrico con cualquier número de distribuciones, o seguir los enfoques no paramétricos bayesianos que he escuchado. SEM estimado usando ML se supone (normalmente) que es normal, lo que significa que la independencia condicional es equivalente a tener covarianza cero para 2 nodos en el gráfico. Personalmente, creo que es una suposición bastante fuerte y que tendría muy poca robustez para modelar la especificación errónea.

AdamO
fuente
Eso podría ser una diferencia en lo que los profesionales llaman su análisis, pero nada obliga a un sistema de ecuaciones estructurales a ser paramétrico. @zkurtz: Hay una discusión larga y técnicamente detallada de lo que son los SEM en la Causalidad de Pearl. Si no tiene el libro, podría intentar publicar un breve resumen y localizar el ejemplo al que se refiere en el enlace que publicó.
CloseToC
Si bien es cierto que las estimaciones de covarianza son consistentes para los modelos de probabilidad no normales, el problema principal es la interpretación de la covarianza 0 como independencia condicional. En general, eso solo se puede decir de las variables distribuidas normalmente.
AdamO
2

Realmente no entiendo esto, pero mira aquí :

Los modelos de ecuaciones estructurales y las redes bayesianas parecen estar tan íntimamente conectados que podría ser fácil olvidar las diferencias. El modelo de ecuaciones estructurales es un objeto algebraico. Mientras el gráfico causal siga siendo acíclico, las manipulaciones algebraicas se interpretan como intervenciones en el sistema causal. La red bayesiana es un modelo estadístico generativo que representa una clase de distribuciones de probabilidad conjunta y, como tal, no admite manipulaciones algebraicas. Sin embargo, la representación simbólica de su factorización de Markov es un objeto algebraico, esencialmente equivalente al modelo de ecuación estructural.

zkurtz
fuente
Específicamente, me pregunto qué quieren decir con "manipulaciones algebraicas" en este contexto.
zkurtz