Los gráficos acíclicos dirigidos (DAG; por ejemplo, Groenlandia, et al, 1999) son parte de un formalismo de inferencia causal de la interpretación contrafáctica del campo de causalidad. En estos gráficos, la presencia de una flecha de la variable a la variable afirma que la variable causa directamente (algún cambio en el riesgo de) la variable , y la ausencia de dicha flecha afirma que la variable no causa directamente (algún cambio en el riesgo de) la variable .
Como ejemplo, la declaración "la exposición al humo de tabaco causa directamente un cambio en el riesgo de mesotelioma" está representada por la flecha negra de "exposición al humo de tabaco" a "mesotelioma" en el diagrama causal que no es un DAG a continuación.
Del mismo modo, la declaración "la exposición al asbesto causa directamente un cambio en el riesgo de mesotelioma" está representada por la flecha negra de "exposición al asbesto" a "mesotelioma" en el gráfico causal que no es un DAG a continuación.
Utilizo el término no un DAG para describir el gráfico causal a continuación debido a la flecha roja, que tengo la intención de afirmar algo como "la exposición al asbesto causa un cambio en el efecto causal directo de la exposición al humo tabaco sobre el riesgo de mesotelioma" (el asbesto es físico daño a las células del pulmón que, además de causar un cambio directo en el riesgo de mesotelioma, también hace que las células sean más susceptibles a los daños cancerígenos de la exposición al humo del tabaco, con el resultado de que la exposición tanto al asbesto como al tabaco aumenta el riesgo que es más que la suma de los dos riesgos separados), y esto no encaja con el significado formal de las flechas causales en los DAG que describí al comienzo de mi pregunta (es decir, porque la flecha roja no termina en una variable ).
¿Cómo se representan correctamente los efectos de interacción dentro del formalismo visual de un DAG?
Referencias
Groenlandia, S., Pearl, J. y Robins, JM (1999). Diagramas causales para la investigación epidemiológica . Epidemiología , 10 (1): 37–48.
fuente
Respuestas:
La teoría de la causalidad de Pearl es completamente no paramétrica . Las interacciones no se hacen explícitas por eso, ni en el gráfico ni en las ecuaciones estructurales que representa. Sin embargo, los efectos causales pueden variar (ampliamente) por suposición.
Si se identifica un efecto y lo estima a partir de datos de forma no paramétrica, obtiene una distribución completa de los efectos causales (en lugar de, por ejemplo, un solo parámetro). En consecuencia, puede evaluar el efecto causal de la exposición al tabaco condicional a la exposición al asbesto de forma no paramétrica para ver si cambia, sin comprometerse con ninguna forma funcional.
Echemos un vistazo a las ecuaciones estructurales en su caso, que corresponden a su "DAG" despojado de la flecha roja:
Hemos dejado las funciones respectivas f () y las distribuciones de los errores sin especificar, excepto por decir que estas últimas son independientes. No obstante, podemos aplicar la teoría de Pearl e inmediatamente afirmar que se identifican los efectos causales de la exposición al tabaco y al asbesto en el mesotelioma . Esto significa que si tuviéramos infinitas observaciones de este proceso, podríamos medir exactamente el efecto de establecer las exposiciones a diferentes niveles simplemente viendo las incidencias de mesotelioma en individuos con diferentes niveles de exposición. Entonces podríamos inferir causalidad sin hacer un experimento real. Esto se debe a que no existen vías de acceso desde las variables de exposición a la variable de resultado.
Entonces obtendrías
P (mesotelioma | do (tabaco = t)) = P (mesotelioma | tabaco = t)
La misma lógica es válida para el efecto causal del asbesto, que le permite evaluar simplemente:
P (mesotelioma | Tabaco = t, Asbesto = a) - P (mesotelioma | Tabaco = t ', Asbesto = a)
en comparación con
P (mesotelioma | Tabaco = t, Asbesto = a ') - P (mesotelioma | Tabaco = t', Asbesto = a ')
para todos los valores relevantes de t y a para estimar los efectos de interacción.
En su ejemplo concreto, supongamos que la variable de resultado es una variable de Bernoulli (puede tener mesotelioma o no) y que una persona ha estado expuesta a un nivel muy alto de asbesto a. Entonces, es muy probable que sufra de mesotelioma; en consecuencia, el efecto de aumentar la exposición al tabaco será muy bajo. Por otro lado, si los niveles de asbesto a 'son muy bajos, aumentar la exposición al tabaco tendrá un efecto mayor. Esto constituiría una interacción entre los efectos del tabaco y el asbesto.
Por supuesto, la estimación no paramétrica puede ser extremadamente exigente y ruidosa con datos finitos y muchos valores diferentes de t y a, por lo que puede pensar en asumir alguna estructura en f (). Pero básicamente puedes hacerlo sin eso.
fuente
La respuesta simple es que ya lo haces. Los DAG convencionales no solo representan los efectos principales, sino más bien la combinación de los efectos principales y las interacciones. Una vez que haya dibujado su DAG, ya asume que las variables que apuntan al mismo resultado pueden modificar el efecto de las otras que apuntan al mismo resultado. Es una suposición de modelado, separada del DAG, que supone la falta de interacción.
Además, la interacción puede ocurrir sin incluir un término de interacción explícito en su modelo. Si incluye los efectos principales solo en un modelo para la relación de riesgo de Y con respecto al tratamiento T y la covariable Q, la estimación de la diferencia de riesgo diferirá según el nivel de Q. Para acomodar todas estas posibilidades de manera no paramétrica, los DAG hacen solo los supuestos más débiles sobre la forma funcional de las relaciones entre las variables, y asumir que no hay interacción es un supuesto más fuerte que permite una interacción. Esto nuevamente significa que los DAG ya permiten la interacción sin ningún ajuste. Ver Vanderweele (2009) para una discusión sobre la interacción que usa DAG convencionales pero permite la interacción.
Bollen y Paxton (1998) y Muthén y Asparouhov (2015) demuestran interacciones en modelos de ruta con variables latentes, pero estas interacciones se refieren explícitamente a términos de productos en un modelo paramétrico en lugar de interacciones en general. También he visto diagramas similares a los suyos donde la flecha causal apunta a una ruta, pero estrictamente hablando, una ruta no es una cantidad única en la que una variable puede tener un efecto causal (aunque esa sea la forma en que queremos interpretar nuestros modelos) ; simplemente representa la presencia de un efecto causal, no su magnitud.
Bollen, KA y Paxton, P. (1998). Interacciones de variables latentes en modelos de ecuaciones estructurales. Modelado de ecuaciones estructurales: una revista multidisciplinaria, 5 (3), 267-293.
Muthén, B. y Asparouhov, T. (2015). Interacciones variables latentes.
VanderWeele, TJ (2009). Sobre la distinción entre interacción y modificación de efectos. Epidemiología, 20 (6), 863-871.
fuente