Puedo pensar en al menos un ejemplo ingenuo. Supongamos que quiero estudiar la relación entre X y Z. También sospecho que Y influye en Z, así que controlo para Y. Sin embargo, resulta que, sin que yo lo sepa, X causa Y e Y causa Z. Por lo tanto, controlando para Y, "encubro" la relación entre X y Z, ya que X es independiente de Z dado Y.
Ahora, en el ejemplo anterior, puede darse el caso de que las relaciones que debería estar estudiando son las que existen entre X e Y, e Y y Z. Sin embargo, si supiera esas cosas a priori, no estaría haciendo ciencia en El primer lugar. El estudio que hice ahora sugiere que no hay una relación entre X y Z, que no es el caso ... X y Z están relacionados.
Esto se ilustra en el siguiente diagrama de dependencia. En el escenario correcto, Z depende de X e Y y X e Y son independientes. Controlamos correctamente que Y determine la relación entre X y Z. En el escenario de la izquierda, Z depende de Y, que depende de X. X y Z son independientes dado Y, por lo que la relación entre X y Z se "cubre" al controlar Y.
Mi pregunta es básicamente "¿Cuándo es apropiado controlar la variable Y y cuándo no?" ... Puede ser difícil o imposible investigar completamente la relación entre X e Y, pero, por ejemplo, controlar Y en un nivel dado es una opción. ¿Cómo decidimos antes de realizar nuestro estudio, y cuáles son las trampas comunes de controlar demasiado o muy poco?
Citas apreciadas.
Respuestas:
El condicionamiento (es decir, el ajuste) de las probabilidades de algún resultado dado algún predictor en terceras variables se practica ampliamente, pero como usted señala correctamente, en realidad puede introducir sesgo en la estimación resultante como una representación de los efectos causales . Esto puede suceder incluso con definiciones "clásicas" de un posible factor de confusión causal, porque tanto el factor de confusión en sí mismo como el predictor de interés pueden tener más factores de confusión causales aguas arriba. En el DAG a continuación, por ejemplo, es un factor de confusión clásico del efecto causal de E sobre D , porque (1) causa y, por lo tanto, está asociado con E , y (2) está asociado con D, ya que está asociado conL E D E D que está asociado con D . Sin embargo, ya sea condicionando o estratificando P ( DU2 D en L (un "colisionador") producirá estimaciones causales sesgadas del efecto de E en D porque L está confundido con D por la variable no medida U 2 , y L está confundido con EP(D|E) L E D L D U2 L E por la variable no medida .U1
La comprensión de qué variables condicionar o estratificar el análisis para proporcionar una estimación causal imparcial requiere una cuidadosa consideración de los posibles DAG utilizando los criterios para la identificación del efecto causal (no hay causas comunes que no estén bloqueadas por los caminos de puerta trasera) descritos por Pearl, Robins y otros. . No hay atajos. Aprende patrones comunes de confusión. Aprenda patrones de sesgo de selección comunes. Práctica.
Referencias
Groenlandia, S., Pearl, J. y Robins, JM (1999). Diagramas causales para la investigación epidemiológica . Epidemiología , 10 (1): 37–48.
Hernán, MA y Robins, JM (2018). Inferencia causal . Chapman & Hall / CRC, Boca Ratón, FL
Maldonado, G. y Groenlandia, S. (2002). Estimación de efectos causales . Revista Internacional de Epidemiología , 31 (2): 422–438.
Pearl, J. (2000). Causalidad: modelos, razonamiento e inferencia . Prensa de la Universidad de Cambridge.
fuente
Creo que la respuesta rápida de una oración a tu pregunta,
es el "criterio de puerta trasera".
El modelo causal estructural de Judea Pearl puede decirle definitivamente qué variables son suficientes (y cuando es necesario) para el condicionamiento, para inferir el impacto causal de una variable en otra. A saber, esto se responde utilizando el criterio de puerta trasera, que se describe en la página 19 de este artículo de revisión de Pearl.
La advertencia principal es que requiere que se conozca la relación causal entre las variables (en forma de flechas direccionales en un gráfico). No hay forma de evitar eso. Aquí es donde la dificultad y la posible subjetividad pueden entrar en juego. El modelo causal estructural de Pearl solo le permite saber cómo responder las preguntas correctas dado un modelo causal (es decir, un gráfico dirigido), qué conjunto de modelos causales son posibles dada una distribución de datos, o cómo buscar la estructura causal realizando el experimento correcto. No le dice cómo encontrar la estructura causal correcta dada solo la distribución de datos. De hecho, afirma que esto es imposible sin el uso de conocimiento / intuición externa sobre el significado de las variables.
Los criterios de la puerta trasera se pueden establecer de la siguiente manera:
Para encontrar el impacto causal de en Y , un conjunto de nodos variables S es suficiente para condicionarse siempre que cumpla los dos criterios siguientes:X Y, S
1) Ningún elemento en es descendiente de XS X
2) bloquea todos los caminos de "puerta trasera" entre X e YS X Y
Aquí, un camino "puerta trasera" es simplemente un camino de flechas que comienzan en y final con una flecha apuntando a X . (La dirección que señalan todas las demás flechas no es importante). Y el "bloqueo" es, en sí mismo, un criterio que tiene un significado específico, que se da en la página 11 del enlace anterior. Este es el mismo criterio que leerías al aprender sobre la "separación D". Personalmente, encontré que el capítulo 8 de Bishop's Pattern Recognition and Machine Learning describe el concepto de bloqueo en la separación D mucho mejor que la fuente de Pearl que he vinculado anteriormente. Pero es así:Y X.
Un conjunto de nodos, bloquea una ruta entre X e Y si cumple al menos uno de los siguientes criterios:S, X Y
1) Uno de los nodos en la ruta, que también está en emite al menos una flecha en la ruta (es decir, la flecha apunta hacia afuera del nodo)S,
2) Un nodo que no está ni en ni un ancestro de un nodo en SS S tiene dos flechas en el camino "colisionando" hacia él (es decir, encontrándose cara a cara)
Este es un criterio o , a diferencia del criterio general de puerta trasera que es un y criterio .
Para tener claridad sobre el criterio de puerta trasera, lo que le dice es que, para un modelo causal dado, al condicionar una variable suficiente, puede aprender el impacto causal de la distribución de probabilidad de los datos. (Como sabemos, la distribución conjunta por sí sola no es suficiente para encontrar el comportamiento causal porque las estructuras causales múltiples pueden ser responsables de la misma distribución. Es por eso que también se requiere el modelo causal). métodos de aprendizaje automático en los datos de observación. Así que siempre que lo sepas que la estructura causal permite condicionar una variable (o un conjunto de variables), su estimación del impacto causal de una variable en otra es tan buena como su estimación de la distribución de los datos, que obtiene a través de métodos estadísticos.
Esto es lo que encontramos cuando aplicamos el criterio de puerta trasera a sus dos diagramas:
Como mencioné antes, el uso del criterio de puerta trasera requiere que conozca el modelo causal (es decir, el diagrama "correcto" de flechas entre las variables). Pero el Modelo causal estructural, en mi opinión, también ofrece la mejor y más formal forma de buscar dicho modelo, o saber cuándo la búsqueda es inútil. También tiene el maravilloso efecto secundario de hacer obsoletos términos como "confusión", "mediación" y "espurio" (todo lo cual me confunde). Solo muéstrame la imagen y te diré qué círculos deben controlarse.
fuente
Lo siguiente podría o no ser apropiado para su caso: si se
X
trata de un tratamiento, entonces podría solucionar su problema utilizando una coincidencia de puntaje de propensión en la que aún mantendría la variableY
cuando haga la coincidencia. En otras palabras, equilibra las covariables (Y
es una de esas covariables) que predicen recibir el tratamientoX
.Observe cómo no hay referencia a la variable de resultado
Z
en lo anterior. También puede verificar qué tan equilibradas están sus observaciones (generando una tabla de equilibrio de antes y después), lo que podría darle una idea de cuántoX
está determinado porY
.fuente