¿Cuáles son las técnicas empíricas para mostrar la causalidad?

12

Una regresión lineal simple solo muestra la correlación entre dos variables. Para establecer la causalidad, dos métodos comúnmente enseñados son la regresión IV y los experimentos naturales. ¿Cuáles son los otros métodos que las personas usan para establecer la causalidad?

Bravo
fuente
2
Se discute si la regresión IV dice mucho acerca de la causalidad
EnergyNumbers

Respuestas:

15

Los experimentos naturales suelen ser un escenario de inferencia causal en lugar de una herramienta de inferencia causal per se. De todos modos, a menudo necesita emplear algo como la diferencia en la diferencia o variables instrumentales, incluso cuando tiene un experimento natural.

Aquí una lista de enfoques estadísticos de inferencia causal (Enfoque: descripción de Lay)

  • Variables instrumentales : la variable X asignada al azar influye en Z solo a través de Y
  • Diferencia en las diferencias : si dos grupos tienen una tendencia común y solo se trata un grupo, entonces el cambio en la diferencia entre los grupos es el efecto del tratamiento
  • Discontinuidad de regresión : si un umbral difícil determina el tratamiento, observe la diferencia alrededor de ese umbral
  • Concordancia de puntaje de propensión : cree un grupo de control haciendo coincidir las observaciones no tratadas que probablemente fueron tratadas (pero de hecho no tratadas) con observaciones tratadas con una probabilidad de tratamiento similar.
  • Coincidencia de distancia de Manhalobis : cree un grupo de control haciendo coincidir las observaciones no tratadas que se parecen a las tratadas. Otra medida de distancia notable es la coincidencia exacta aproximada .
  • Control sintético : cuando solo tiene una observación tratada, cree un compuesto de observaciones no tratadas que individualmente son controles imperfectos pero que colectivamente actúan como un buen control.
  • Cohortes sintéticas: trate las observaciones repetidas de grupos como un panel de individuos y emplee técnicas de panel.
  • Modelado de sesgo de selección como la corrección de Heckman : asuma una forma paramétrica para el sesgo de selección y elimínela, de modo que los resultados de regresión corregidos se puedan interpretar causalmente.
  • Muestra de ponderación más amplia : corrija el sesgo resultante de la participación endógena y la heterogeneidad no modelada ponderando las unidades de muestra para parecerse más a la verdadera población de interés.
BKay
fuente
Para obtener una lista de métodos , puede echar un vistazo a nuestra ReplicationWiki. Se enumeran los estudios que los utilizan, y puede buscar cuáles de ellos tienen datos y códigos disponibles, como aquí para ver las diferencias en las diferencias .
Jan Höffler
1

La diferencia en la diferencia es probablemente el método favorito en econometría (aunque requiere arranque, es decir, corregir los datos de la autocorrelación). Básicamente compara la evolución de dos grupos, desde un punto en el que ninguno está sujeto al factor dado hasta un punto en el que uno de ellos está sujeto al factor. Un ejemplo famoso es el uso que hace Card y Krueger del método para investigar el impacto de un salario mínimo.

VicAche
fuente
Si alguien sabe cómo puedo reducir esa imagen, siéntase libre de editar;)
VicAche
Simplemente utilice el código de imagen HTML estándar: (por ejemplo, <img src = "URL" width = "100" height = "100">)
BKay
1
La diferencia en la diferencia no establece la causalidad. Establece el posible tamaño de un efecto; pero no la causalidad.
EnergyNumbers
Cuantificar los efectos es estimar la causalidad, al menos como OP lo entiende.
VicAche
1

El diseño de regresión discontinua al igual que la diferencia en diferencias es un método para explotar experimentos naturales. Se basa en reglas arbitrarias que dan diferentes "tratamientos" a unidades similares.

Un ejemplo de Wikipedia:

Si todos los estudiantes por encima de un grado dado, por ejemplo, el 80%, reciben la beca, es posible obtener el efecto del tratamiento local al comparar a los estudiantes alrededor del límite del 80%: la intuición aquí es que un estudiante con un puntaje del 79% es probable ser muy similar a un estudiante con un puntaje del 81%, dado el umbral predefinido del 80%, sin embargo, un estudiante recibirá la beca mientras que el otro no. La comparación del resultado del adjudicatario (grupo de tratamiento) con el resultado contrafactual del no receptor (grupo de control) generará el efecto del tratamiento local.

snoram
fuente
1

Para seguir el comentario de @EnergyNumbers, la causalidad fluye de su teoría .

Una distinción clave es esta: la matemática en cualquiera de los métodos en la respuesta de @ BKay está diseñada para escupir números al final del procedimiento. Por ejemplo, considere un diff-in-diff donde su tratamiento es algo tonto como ser lamido en la cara por un perro. Siempre puedes configurar un diff-in-diff para ver si ser lamido en la cara por perros hace que las personas se conviertan en astronautas.

Dejando de lado las tonterías, pensar en la causalidad desde cero puede ser muy útil, ya que incluye su elección del procedimiento. Los seminarios en economía frecuentemente giran en torno a la viabilidad de la teoría y la validez de los supuestos.

Pat W.
fuente