¿Cómo representar correctamente las variables de diferencia en DAG?

8

Si estoy interesado en los efectos causales del cambio en una variable (E) sobre algún resultado (O), ¿cómo representaría eso en un gráfico acíclico dirigido (DAG)?

Suponer ΔE2=E2E1, dónde E1 Y E2 ocurrirá en los momentos 1 y 2, sería un DAG correcto:

1. Suponiendo que ΔE2 simplemente es capturado por todos los niveles de E1 y E2( A la efectos de la interacción de la misma manera están tan capturados)?



2. Suponiendo que ΔE2 es una variable causalmente distinta de E1 y E2, pero que requieren la presencia de esas variables?



3. Suponiendo que ΔE2 es independiente de E1 Y E2 y estos últimos no son necesarios para representar los efectos de ΔE2?


  1. ¿Algo más?

NOTA: " DAG " no significa "ningún tipo de gráfico causal o correlacional", sino que es un formalismo estrictamente proscrito que representa las creencias causales.


Mi motivación es que estoy tratando de pensar en la representación DAG de modelos dinámicos como el modelo de corrección de errores generalizado:

ΔOt=β0+βc(Ot1Et1)+βΔEΔEt+βEEt1+εt

Por supuesto, la estimación del parámetro sin procesar se transforma para interpretar el modelo como se muestra a continuación, por lo que quizás DAGAR el modelo anterior sería aún más complicado.

Efecto instantáneo a corto plazo del cambio en E en ΔO: βΔE

Efecto rezagado a corto plazo del nivel de E en ΔO: βEβcβΔE

Efecto de equilibrio a largo plazo de retraso E en ΔO: βcβEβc

Alexis
fuente

Respuestas:

4

La solución es pensar funcionalmente.

El valor de ΔE2=f(E1,E2) más específicamenteΔE2=E2E1. Por lo tanto, las variables de diferencia se pueden representar en los DAG mediante la opción 4, "otra cosa" (este DAG suponeE1 y E2 causa directa O Además de su diferencia):

Si E1 Y E2 no tienen efectos directos sobre O, ΔE2 sigue siendo una función de sus padres:

Si reescribimos el modelo de corrección de error generalizado de un solo retraso de este modo (Qt1 para 'término eQuilibrium', donde Qt1=Ot1Et1):

ΔOt=β0+βc(Qt1)+βΔEΔEt+βEEt1+εt

Entonces el DAG subyacente al modelo para ΔOt (ignorando a sus descendientes en t+1) es:

Los efectos de E en ΔOt del modelo, por lo tanto, ingrese del término de equilibrio Qt1, desde Et1 y del término de cambio ΔEt. Otras causas deOt1, Ot, Et1 y Et (p. ej., variables no modeladas, entradas aleatorias) se dejan implícitas.

La parte de esta respuesta correspondiente a los dos primeros DAG es cortesía de la comunicación personal con Miguel Hernán.

Alexis
fuente
1

EDITAR:

Si solo le interesa representar relaciones no paramétricas entre sus variables, creo que 1) sería lo más apropiado. Si bien puede haber una forma funcional más específica que relacione las dos variables con el resultado, en un DAG no es necesario representar esa forma. Por otro lado, si desea utilizar un diagrama de ruta que represente un modelo de ecuación estructural lineal como el que escribió, tendría sentido incluir la puntuación de diferencia en el diagrama; de esta manera, el modelo específico que escribió y el diagrama serían igualmente específicos. Un DAG es más vago (pero también más flexible) ya que no requiere (o no es necesario permitir) una forma de función específica.

Podría reducirse al objetivo de dibujar su DAG. Si su objetivo es representar con la mayor precisión posible las relaciones entre sus variables, tendría sentido incluir el término de diferencia como su propia variable, ya que tiene su propia fuerza causal. Un gráfico sin él también sería válido. En teoría, podría hacer las mismas declaraciones de independencia condicional sobre el resultado y los predictores con un DAG más detallado que con uno menos detallado.


Mi intuición está más cerca de 3). Si es verdad queE1 y E2 no afecta directamente O excepto a través de su diferencia, entonces 3) es correcto, y agregaría bordes de E1 y E2 a ΔE2 y de E1 a E2por completitud. Ningún otro nodo apuntaría a la variable de diferencia, pero las variables que predicen la diferencia apuntarían aE1 y / o E2. Gráficamente, lo que estoy describiendo es:

E1
 |---->  E2-E1 ---> O
 V       ^
E2-------|

con posibles flechas adicionales de E1 y E2 a O si afectan O más allá de su efecto a través de su diferencia.

Noé
fuente
"Si es cierto que E1 y E2 no afectan directamente a O, excepto por su diferencia", parece ignorar el modelo que especifiqué.
Alexis
Segunda preocupación La variable de interacciónE1×E2 es puramente una función de E1 y E2, sin embargo, dicha variable no se representaría ya que ha dibujado el DAG en su respuesta , por lo que no me queda claro que incluso si estuviera interesado en el modeloΔO=β0+ΔE2+εque tu DAG sería correcto
Alexis
Esas son buenas preocupaciones. Estaba ignorando el modelo que especificó y centrándome en su pregunta. ¿Desea especificar un diagrama de ruta que represente un modelo de ecuación estructural lineal o un DAG no paramétrico? Si es lo primero, querrá incluir el término de diferencia como su propia variable. De lo contrario, como mencionó, sería apropiado no hacerlo (tal como sería con una interacción). Revisaré mi respuesta.
Noah
La pregunta no tiene nada que ver con los SEM. Se nota porque SEM no aparece en la pregunta, incluso como una etiqueta. :) Por otro lado, mi pregunta es sobre DAG. :) Además: con respecto a mi segundo comentario "no está del todo claro" no significa que no estés correcto ... solo significa que necesito persuadir sobre los formalismos de DAG.
Alexis
1
Mi respuesta probablemente no sea muy persuasiva, pero espero que alguien más pueda hacer un mejor trabajo. El modelo que escribió es un SEM lineal, por lo que, aunque no preguntó específicamente al respecto, si está tratando de relacionar algún tipo de diagrama de ruta con los términos de un modelo, se está aventurando en el territorio del diagrama de ruta SEM.
Noah