¿Cómo representar correctamente las variables de diferencia en DAG?

Si estoy interesado en los efectos causales del cambio en una variable ( $E$ ) sobre algún resultado ( $O$ ), ¿cómo representaría eso en un gráfico acíclico dirigido (DAG)?

Suponer $\Delta E_2 = E_2 - E_1$ , dónde $E_1$ Y $E_2$ ocurrirá en los momentos 1 y 2, sería un DAG correcto:

1. Suponiendo que $\Delta E_2$ simplemente es capturado por todos los niveles de $E_1$ y $E_2$ ( A la efectos de la interacción de la misma manera están tan capturados)?

DAG 1: E_1 y E_2 ambos causan O

2. Suponiendo que $\Delta E_2$ es una variable causalmente distinta de $E_1$ y $E_2$ , pero que requieren la presencia de esas variables?

DAG 2: E_1, E_2 y Delta E todos causan O

3. Suponiendo que $\Delta E_2$ es independiente de $E_1$ Y $E_2$ y estos últimos no son necesarios para representar los efectos de $\Delta E_2$ ?

DAG 3: Delta E causa O

¿Algo más?

NOTA: " DAG " no significa "ningún tipo de gráfico causal o correlacional", sino que es un formalismo estrictamente proscrito que representa las creencias causales.

Mi motivación es que estoy tratando de pensar en la representación DAG de modelos dinámicos como el modelo de corrección de errores generalizado:

Δ O_{t} = β_{0} + β_{c} (O_{t - 1} - E_{t - 1}) + β_{Δ E} Δ E_{t} + β_{E} E_{t - 1} + ε_{t}

$\Delta O_t = \beta_{0} + \beta_{\text{c}}\left(O_{t-1} - E_{t-1}\right) + \beta_{\Delta E}\Delta E_{t} + \beta_E E_{t-1} + \varepsilon_t$

Por supuesto, la estimación del parámetro sin procesar se transforma para interpretar el modelo como se muestra a continuación, por lo que quizás DAGAR el modelo anterior sería aún más complicado.

Efecto instantáneo a corto plazo del cambio en $E$ en $\Delta O$ : $\beta_{\Delta E}$

Efecto rezagado a corto plazo del nivel de $E$ en $\Delta O$ : $\beta_{E} - \beta_{\text{c}} - \beta_{\Delta E}$

Efecto de equilibrio a largo plazo de retraso $E$ en $\Delta O$ : $\frac{\beta_{\text{c}} - \beta_{E}}{\beta_{\text{c}}}$

time-series dag Alexis
fuente

Respuestas:

La solución es pensar funcionalmente.

El valor de $\Delta E_{2} = f(E_{1},E_{2})$ más específicamente $\Delta E_{2} = E_{2} - E_{1}$ . Por lo tanto, las variables de diferencia se pueden representar en los DAG mediante la opción 4, "otra cosa" (este DAG supone $E_{1}$ y $E_{2}$ causa directa $O$ Además de su diferencia):

DAG de la variable de diferencia con efectos directos de las variables principales

Si $E_{1}$ Y $E_{2}$ no tienen efectos directos sobre $O$ , $\Delta E_{2}$ sigue siendo una función de sus padres:

DAG de una variable de diferencia sin efectos directos de las variables principales

Si reescribimos el modelo de corrección de error generalizado de un solo retraso de este modo ( $Q_{t-1}$ para 'término eQuilibrium', donde $Q_{t-1} = O_{t-1} - E_{t-1}$ ):

Δ O_{t} = β_{0} + β_{c} (Q_{t - 1}) + β_{Δ E} Δ E_{t} + β_{E} E_{t - 1} + ε_{t}

$\Delta O_t = \beta_{0} + \beta_{\text{c}}\left(Q_{t-1}\right) + \beta_{\Delta E}\Delta E_{t} + \beta_E E_{t-1} + \varepsilon_t$

Entonces el DAG subyacente al modelo para $\Delta O_{t}$ (ignorando a sus descendientes en $t+1$ ) es:

Segmento de aDAG en el tiempo t para un modelo de corrección de errores generalizado

Los efectos de $E$ en $\Delta O_{t}$ del modelo, por lo tanto, ingrese del término de equilibrio $Q_{t-1}$ , desde $E_{t-1}$ y del término de cambio $\Delta E_{t}$ . Otras causas de $O_{t-1}$ , $O_{t}$ , $E_{t-1}$ y $E_{t}$ (p. ej., variables no modeladas, entradas aleatorias) se dejan implícitas.

La parte de esta respuesta correspondiente a los dos primeros DAG es cortesía de la comunicación personal con Miguel Hernán.

Alexis
fuente

EDITAR:

Si solo le interesa representar relaciones no paramétricas entre sus variables, creo que 1) sería lo más apropiado. Si bien puede haber una forma funcional más específica que relacione las dos variables con el resultado, en un DAG no es necesario representar esa forma. Por otro lado, si desea utilizar un diagrama de ruta que represente un modelo de ecuación estructural lineal como el que escribió, tendría sentido incluir la puntuación de diferencia en el diagrama; de esta manera, el modelo específico que escribió y el diagrama serían igualmente específicos. Un DAG es más vago (pero también más flexible) ya que no requiere (o no es necesario permitir) una forma de función específica.

Podría reducirse al objetivo de dibujar su DAG. Si su objetivo es representar con la mayor precisión posible las relaciones entre sus variables, tendría sentido incluir el término de diferencia como su propia variable, ya que tiene su propia fuerza causal. Un gráfico sin él también sería válido. En teoría, podría hacer las mismas declaraciones de independencia condicional sobre el resultado y los predictores con un DAG más detallado que con uno menos detallado.

Mi intuición está más cerca de 3). Si es verdad que $E_1$ y $E_2$ no afecta directamente $O$ excepto a través de su diferencia, entonces 3) es correcto, y agregaría bordes de $E_1$ y $E_2$ a $\Delta E_2$ y de $E_1$ a $E_2$ por completitud. Ningún otro nodo apuntaría a la variable de diferencia, pero las variables que predicen la diferencia apuntarían a $E_1$ y / o $E_2$ . Gráficamente, lo que estoy describiendo es:

E1
 |---->  E2-E1 ---> O
 V       ^
E2-------|

con posibles flechas adicionales de $E_1$ y $E_2$ a $O$ si afectan $O$ más allá de su efecto a través de su diferencia.

Noé
fuente

"Si es cierto que E1 y E2 no afectan directamente a O, excepto por su diferencia", parece ignorar el modelo que especifiqué.

Alexis

Segunda preocupación La variable de interacción

E_{1} \times E_{2}

$E_{1}\times E_{2}$ es puramente una función de

E_{1}

$E_{1}$ y

E_{2}

$E_{2}$ , sin embargo, dicha variable no se representaría ya que ha dibujado el DAG en su respuesta , por lo que no me queda claro que incluso si estuviera interesado en el modelo

Δ O = β_{0} + Δ E_{2} + ε

$\Delta O = \beta_{0} + \Delta E_{2} + \varepsilon$ que tu DAG sería correcto

Alexis

Esas son buenas preocupaciones. Estaba ignorando el modelo que especificó y centrándome en su pregunta. ¿Desea especificar un diagrama de ruta que represente un modelo de ecuación estructural lineal o un DAG no paramétrico? Si es lo primero, querrá incluir el término de diferencia como su propia variable. De lo contrario, como mencionó, sería apropiado no hacerlo (tal como sería con una interacción). Revisaré mi respuesta.

Noah

La pregunta no tiene nada que ver con los SEM. Se nota porque SEM no aparece en la pregunta, incluso como una etiqueta. :) Por otro lado, mi pregunta es sobre DAG. :) Además: con respecto a mi segundo comentario "no está del todo claro" no significa que no estés correcto ... solo significa que necesito persuadir sobre los formalismos de DAG.

Alexis

Mi respuesta probablemente no sea muy persuasiva, pero espero que alguien más pueda hacer un mejor trabajo. El modelo que escribió es un SEM lineal, por lo que, aunque no preguntó específicamente al respecto, si está tratando de relacionar algún tipo de diagrama de ruta con los términos de un modelo, se está aventurando en el territorio del diagrama de ruta SEM.

Noah