Representación de efectos de interacción en gráficos acíclicos dirigidos

Los gráficos acíclicos dirigidos (DAG; por ejemplo, Groenlandia, et al, 1999) son parte de un formalismo de inferencia causal de la interpretación contrafáctica del campo de causalidad. En estos gráficos, la presencia de una flecha de la variable $A$ a la variable $B$ afirma que la variable $A$ causa directamente (algún cambio en el riesgo de) la variable $B$ , y la ausencia de dicha flecha afirma que la variable $A$ no causa directamente (algún cambio en el riesgo de) la variable $B$ .

Como ejemplo, la declaración "la exposición al humo de tabaco causa directamente un cambio en el riesgo de mesotelioma" está representada por la flecha negra de "exposición al humo de tabaco" a "mesotelioma" en el diagrama causal que no es un DAG a continuación.

Del mismo modo, la declaración "la exposición al asbesto causa directamente un cambio en el riesgo de mesotelioma" está representada por la flecha negra de "exposición al asbesto" a "mesotelioma" en el gráfico causal que no es un DAG a continuación.

Utilizo el término no un DAG para describir el gráfico causal a continuación debido a la flecha roja, que tengo la intención de afirmar algo como "la exposición al asbesto causa un cambio en el efecto causal directo de la exposición al humo tabaco sobre el riesgo de mesotelioma" (el asbesto es físico daño a las células del pulmón que, además de causar un cambio directo en el riesgo de mesotelioma, también hace que las células sean más susceptibles a los daños cancerígenos de la exposición al humo del tabaco, con el resultado de que la exposición tanto al asbesto como al tabaco aumenta el riesgo que es más que la suma de los dos riesgos separados), y esto no encaja con el significado formal de las flechas causales en los DAG que describí al comienzo de mi pregunta (es decir, porque la flecha roja no termina en una variable ).

¿Cómo se representan correctamente los efectos de interacción dentro del formalismo visual de un DAG?

Referencias

Groenlandia, S., Pearl, J. y Robins, JM (1999). Diagramas causales para la investigación epidemiológica . Epidemiología , 10 (1): 37–48.

interaction causality dag Alexis
fuente

¿Es posible cambiar el DAG agregando un nodo para el daño de las células pulmonares con flechas del tabaco y el asbesto apuntando hacia adentro y una flecha hacia el mesotelioma? Eso mantiene el DAG y proporciona flexibilidad para modelar los efectos individuales y compuestos.

John Woolf

Sí, había pensado en algo así, pero me pregunto si eso también implica que el efecto principal del tabaco no es también el "daño de las células pulmonares", cuando lo es. Supongo que uno podría agregar otra variable 'tabaco y asbesto juntos' causados por el tabaco y el asbesto, pero esto parece torpe ... pero quizás es con lo que uno tiene que ir.

Alexis

¿Qué software usaste para crear el gráfico?

zipzapboing

@zipzapboing lo dibujó a mano en MS Word, o PageStream o Scribus o algo así, luego lo editó para color y transparencia usando GIMP. (En realidad, es un extracto de algunas de mis diapositivas de conferencias.)

Alexis

Respuestas:

La teoría de la causalidad de Pearl es completamente no paramétrica . Las interacciones no se hacen explícitas por eso, ni en el gráfico ni en las ecuaciones estructurales que representa. Sin embargo, los efectos causales pueden variar (ampliamente) por suposición.

Si se identifica un efecto y lo estima a partir de datos de forma no paramétrica, obtiene una distribución completa de los efectos causales (en lugar de, por ejemplo, un solo parámetro). En consecuencia, puede evaluar el efecto causal de la exposición al tabaco condicional a la exposición al asbesto de forma no paramétrica para ver si cambia, sin comprometerse con ninguna forma funcional.

Echemos un vistazo a las ecuaciones estructurales en su caso, que corresponden a su "DAG" despojado de la flecha roja:

$f_{1}$ $\epsilon_{m}$

$f_{2}$ $\epsilon_{t}$

$f_{3}$ $\epsilon_{a}$

$\epsilon$

Hemos dejado las funciones respectivas f () y las distribuciones de los errores sin especificar, excepto por decir que estas últimas son independientes. No obstante, podemos aplicar la teoría de Pearl e inmediatamente afirmar que se identifican los efectos causales de la exposición al tabaco y al asbesto en el mesotelioma . Esto significa que si tuviéramos infinitas observaciones de este proceso, podríamos medir exactamente el efecto de establecer las exposiciones a diferentes niveles simplemente viendo las incidencias de mesotelioma en individuos con diferentes niveles de exposición. Entonces podríamos inferir causalidad sin hacer un experimento real. Esto se debe a que no existen vías de acceso desde las variables de exposición a la variable de resultado.

Entonces obtendrías

P (mesotelioma | do (tabaco = t)) = P (mesotelioma | tabaco = t)

La misma lógica es válida para el efecto causal del asbesto, que le permite evaluar simplemente:

P (mesotelioma | Tabaco = t, Asbesto = a) - P (mesotelioma | Tabaco = t ', Asbesto = a)

en comparación con

P (mesotelioma | Tabaco = t, Asbesto = a ') - P (mesotelioma | Tabaco = t', Asbesto = a ')

para todos los valores relevantes de t y a para estimar los efectos de interacción.

En su ejemplo concreto, supongamos que la variable de resultado es una variable de Bernoulli (puede tener mesotelioma o no) y que una persona ha estado expuesta a un nivel muy alto de asbesto a. Entonces, es muy probable que sufra de mesotelioma; en consecuencia, el efecto de aumentar la exposición al tabaco será muy bajo. Por otro lado, si los niveles de asbesto a 'son muy bajos, aumentar la exposición al tabaco tendrá un efecto mayor. Esto constituiría una interacción entre los efectos del tabaco y el asbesto.

Por supuesto, la estimación no paramétrica puede ser extremadamente exigente y ruidosa con datos finitos y muchos valores diferentes de t y a, por lo que puede pensar en asumir alguna estructura en f (). Pero básicamente puedes hacerlo sin eso.

Julian Schuessler
fuente

Julian, gracias por profundizar en la lógica de causalidad contrafactual de Pearl. Su respuesta mejoraría al hablar de la representación visual de los efectos de interacción que fue central en mi pregunta (tal vez diciendo "Los DAG no hacen explícitos los efectos de interacción", o lo que sea).

Alexis

Sí, tiene usted razón; He tratado de aclarar eso desde el principio.

Julian Schuessler

Julian, eso es genial. Usted dice que los bloques de construcción de un DAG no son enlaces individuales, C = f (D) sino más generalmente conjuntos de enlaces, C = f (D, E, ...). Mi problema es que Pearl a veces es impreciso en esto, por ejemplo, en "Causalidad" su Def 2.2.1 .: "Una estructura causal de un conjunto de variables V es un DAG en el que cada nodo corresponde a un elemento distinto de V, y cada enlace representa la relación funcional directa entre las variables correspondientes ". Seguramente los enlaces individuales de los padres de C a C no significan nada por sí solos, solo muestran participación en una influencia colectiva sobre C. ¿Estás de acuerdo?

Steve Powell

Si. C = f (D, E) se mostraría mediante dos enlaces en el gráfico de D / E a C. La interpretación de los enlaces es que D y E determinan C. Por lo tanto, los enlaces son relacionales.

Julian Schuessler

La respuesta simple es que ya lo haces. Los DAG convencionales no solo representan los efectos principales, sino más bien la combinación de los efectos principales y las interacciones. Una vez que haya dibujado su DAG, ya asume que las variables que apuntan al mismo resultado pueden modificar el efecto de las otras que apuntan al mismo resultado. Es una suposición de modelado, separada del DAG, que supone la falta de interacción.

Además, la interacción puede ocurrir sin incluir un término de interacción explícito en su modelo. Si incluye los efectos principales solo en un modelo para la relación de riesgo de Y con respecto al tratamiento T y la covariable Q, la estimación de la diferencia de riesgo diferirá según el nivel de Q. Para acomodar todas estas posibilidades de manera no paramétrica, los DAG hacen solo los supuestos más débiles sobre la forma funcional de las relaciones entre las variables, y asumir que no hay interacción es un supuesto más fuerte que permite una interacción. Esto nuevamente significa que los DAG ya permiten la interacción sin ningún ajuste. Ver Vanderweele (2009) para una discusión sobre la interacción que usa DAG convencionales pero permite la interacción.

Bollen y Paxton (1998) y Muthén y Asparouhov (2015) demuestran interacciones en modelos de ruta con variables latentes, pero estas interacciones se refieren explícitamente a términos de productos en un modelo paramétrico en lugar de interacciones en general. También he visto diagramas similares a los suyos donde la flecha causal apunta a una ruta, pero estrictamente hablando, una ruta no es una cantidad única en la que una variable puede tener un efecto causal (aunque esa sea la forma en que queremos interpretar nuestros modelos) ; simplemente representa la presencia de un efecto causal, no su magnitud.

Bollen, KA y Paxton, P. (1998). Interacciones de variables latentes en modelos de ecuaciones estructurales. Modelado de ecuaciones estructurales: una revista multidisciplinaria, 5 (3), 267-293.

Muthén, B. y Asparouhov, T. (2015). Interacciones variables latentes.

VanderWeele, TJ (2009). Sobre la distinción entre interacción y modificación de efectos. Epidemiología, 20 (6), 863-871.

Noé
fuente

Además: "Una vez que haya dibujado su DAG, ya asume que cualquier variable que apunte al mismo resultado puede modificar el efecto de las otras que apuntan al mismo resultado. Es una suposición de modelado, separada del DAG, que supone la falta de una interacción ". es brillante ... realmente ayudó a que estas ideas aterrizaran conmigo.

Alexis