¿Just-Identified 2SLS es medianamente imparcial?

13

En Econometría en su mayoría inofensiva: un compañero empirista (Angrist y Pischke, 2009: página 209) leí lo siguiente:

(...) De hecho, el 2SLS recién identificado (digamos, el estimador simple de Wald) es aproximadamente imparcial . Esto es difícil de mostrar formalmente porque 2SLS recién identificado no tiene momentos (es decir, la distribución de muestreo tiene colas gruesas). Sin embargo, incluso con instrumentos débiles, el 2SLS recién identificado está aproximadamente centrado donde debería estar. Por lo tanto, decimos que 2SLS recién identificado es medianamente imparcial. (...)

Aunque los autores dicen que 2SLS recién identificado es medianamente imparcial, no lo prueban ni proporcionan una referencia a una prueba . En la página 213 vuelven a mencionar la propuesta, pero sin hacer referencia a una prueba. Además, no puedo encontrar ninguna motivación para la propuesta en sus notas de clase sobre variables instrumentales del MIT , página 22.

La razón puede ser que la proposición es falsa ya que la rechazan en una nota en su blog . Sin embargo, los 2SLS recién identificados son aproximadamente independientes de la mediana, escriben. Motivan esto usando un pequeño experimento de Monte-Carlo, pero no proporcionan una prueba analítica o una expresión de forma cerrada del término de error asociado con la aproximación. De todos modos, esta fue la respuesta de los autores al profesor Gary Solon de la Universidad Estatal de Michigan, quien hizo el comentario de que 2SLS recién identificado no es medianamente imparcial.

Pregunta 1: ¿Cómo demuestra que el 2SLS recién identificado no es medianamente imparcial como argumenta Gary Solon?

Pregunta 2: ¿Cómo demuestra que el 2SLS recién identificado es aproximadamente imparcial en la mediana como argumenta Angrist y Pischke?

Para la pregunta 1, estoy buscando un contraejemplo. Para la pregunta 2, estoy (principalmente) buscando una prueba o una referencia a una prueba.

También estoy buscando una definición formal de mediana imparcial en este contexto. Entiendo el concepto de la siguiente manera: un estimador de basado en algún conjunto de variables aleatorias es medianamente imparcial para si y solo si la distribución de tiene mediana .θX1:nnθ θ (X1:n)θθ^(X1:n)θX1:nnθθ^(X1:n)θ


Notas

  1. En un modelo recién identificado, el número de regresores endógenos es igual al número de instrumentos.

  2. El marco que describe un modelo de variables instrumentales recién identificado puede expresarse de la siguiente manera: El modelo causal de interés y la ecuación de la primera etapa es donde es una matriz que describe regresores endógenos, y donde las variables instrumentales se describen mediante una matriz . Aquí solo describe algunas variables de control (p. Ej., Agregadas para mejorar la precisión); y y son términos de error. Xk×n+1kk×n+1ZWuv

    (1){Y=Xβ+Wγ+uX=Zδ+Wζ+v
    Xk×n+1kk×n+1ZWuv
  3. Estimamos en usando 2SLS: Primero, retroceda en controlando por y adquiera los valores predichos ; Esto se llama la primera etapa. En segundo lugar, retroceda en controlando para ; Esto se llama la segunda etapa. El coeficiente estimado en en la segunda etapa es nuestra estimación 2SLS de .( 1 ) X Z W X Y X W X ββ(1)XZWX^YX^WX^β

  4. En el caso más simple tenemos el modelo e instrumentamos el regresor endógeno con . En este caso, la estimación 2SLS de es donde denota la covarianza muestral entre y . Podemos simplificar : donde , yx i z i β β 2SLS = s Z Y

    yi=α+βxi+ui
    xiziβsABAB(2) β 2SLS=Σi(yi- ˉ y )zi
    (2)β^2SLS=sZYsZX,
    sABAB(2)
    (3)β^2SLS=i(yiy¯)zii(xix¯)zi=β+i(uiu¯)zii(xix¯)zi
    ˉ x =ixi/n ˉ u =iui/ny¯=iyi/nx¯=ixi/nu¯=iui/n, donde es el número de observaciones.n
  5. Hice una búsqueda en la literatura usando las palabras "recién identificado" y "medianamente imparcial" para encontrar referencias para responder a las preguntas 1 y 2 (ver arriba). No encontré ninguno. Todos los artículos que encontré (ver más abajo) hacen referencia a Angrist y Pischke (2009: página 209, 213) cuando afirman que 2SLS recién identificado es medianamente imparcial.

    • Jakiela, P., Miguel, E. y Te Velde, VL (2015). Te lo has ganado: estimando el impacto del capital humano en las preferencias sociales. Economía experimental , 18 (3), 385-407.
    • An, W. (2015). Estimaciones de variables instrumentales de los efectos de pares en las redes sociales. Social Science Research , 50, 382-394.
    • Vermeulen, W. y Van Ommeren, J. (2009). ¿La planificación del uso del suelo da forma a las economías regionales? Un análisis simultáneo de la oferta de vivienda, la migración interna y el crecimiento del empleo local en los Países Bajos. Revista de Economía de la Vivienda , 18 (4), 294-310.
    • Aidt, TS y Leon, G. (2016). La ventana de oportunidad democrática: evidencia de disturbios en África subsahariana. Revista de resolución de conflictos , 60 (4), 694-717.
Elias
fuente
2
No pude responder esto con una prueba formal, sino con algunos estudios de simulación que muestran que LIML es medianamente imparcial (más definición) y que LIML y 2SLS con una variable endógena y un instrumento tienen la misma distribución de muestra pequeña (por lo tanto, si LIML en este case es medianamente imparcial, entonces también lo es 2SLS). ¿Sería esto suficiente para responder a su pregunta?
Andy
@Andy ¡Esa sería una muy buena respuesta! Quizás suficiente, dependiendo de lo que otros usuarios puedan decir. Probablemente sea suficiente, ya que creo que no hay prueba de la proposición de que 2SLS recién identificado es aproximadamente imparcial en la mediana. Sería bueno con un contraejemplo que muestre que 2SLS recién identificado no es medianamente imparcial; pero creo que es posible (pero quizás difícil) llegar a un contraejemplo yo mismo.
Elias
Por aproximadamente imparcial, ¿quiere decir que el sesgo va a cero como alguna función del número de observaciones, como 1 / no 1 / n ^ 2, etc.?
Igor
@Igor La frase "aproximadamente medianamente imparcial" no la uso yo. Como no sé lo que significa formalmente "medianamente imparcial", no puedo responder a su pregunta. Pero en lo que parece estar pensando es en un estimador que sea asintóticamente imparcial.
Elias

Respuestas:

6

En los estudios de simulación, el término sesgo medio se refiere al valor absoluto de las desviaciones de un estimador de su valor verdadero (que usted conoce en este caso porque es una simulación, por lo que elige el valor verdadero). Puede ver un documento de trabajo de Young (2017) que define el sesgo medio como este en la tabla 15, o Andrews y Armstrong (2016) que trazan gráficos de sesgo medio para diferentes estimadores en la figura 2.

Parte de la confusión (también en la literatura) parece provenir del hecho de que hay dos problemas subyacentes separados:

  1. instrumentos débiles
  2. muchos instrumentos (potencialmente) débiles

El problema de tener un instrumento débil en un entorno recién identificado es muy diferente de tener muchos instrumentos donde algunos son débiles, sin embargo, los dos problemas se combinan a veces.

κ

β^=[X(IκMZ)X]1[X(IκMZ)y)]

MZ=IZ(ZZ)1Z

y=Xβ+uX=Zπ+e.

κκ=0κ=1κdet(XXκXMZX))=0

Asintóticamente, LIML y 2SLS tienen la misma distribución, sin embargo, en muestras pequeñas esto puede ser muy diferente. Este es especialmente el caso cuando tenemos muchos instrumentos y si algunos de ellos son débiles. En este caso, LIML funciona mejor que 2SLS. LIML aquí ha demostrado ser medianamente imparcial. Este resultado proviene de un montón de estudios de simulación. Por lo general, los documentos que indican este resultado se refieren a "Propiedades asintóticas de algunos estimadores en modelos estructurales" de Rothberg (1983), Sawa (1972) o Anderson et al. (1982) .

Steve Pischke proporciona una simulación para este resultado en sus notas de 2016 en la diapositiva 17, que muestra la distribución de OLS, LIML y 2SLS con 20 instrumentos, de los cuales solo uno es realmente útil. El valor del coeficiente verdadero es 1. Usted ve que LIML está centrado en el valor verdadero mientras que 2SLS está sesgado hacia OLS. ingrese la descripción de la imagen aquí

Ahora el argumento parece ser el siguiente: dado que LIML puede mostrarse como medianamente imparcial y que en el caso recién identificado (una variable endógena, un instrumento) LIML y 2SLS son equivalentes, 2SLS también debe ser medianamente imparcial.

Sin embargo, parece que las personas nuevamente están mezclando el "instrumento débil" y el caso de "muchos instrumentos débiles" porque en el entorno recién identificado, tanto LIML como 2SLS estarán sesgados cuando el instrumento sea débil. No he visto ningún resultado donde se demostró que LIML es imparcial en el caso recién identificado cuando el instrumento es débil y no creo que esto sea cierto. Una conclusión similar surge de la respuesta de Angrist y Pischke (2009) a Gary Solo en la página 2, donde simulan el sesgo de OLS, 2SLS y LIML al cambiar la fuerza del instrumento. ingrese la descripción de la imagen aquí

Para coeficientes de primera etapa muy pequeños de <0.1 (manteniendo fijo el error estándar), es decir, baja intensidad del instrumento, 2SLS recién identificado (y, por lo tanto, LIML recién identificado) está mucho más cerca del límite de probabilidad del estimador OLS en comparación con el valor de coeficiente verdadero de 1.

Una vez que el coeficiente de la primera etapa está entre 0.1 y 0.2, notan que la estadística F de la primera etapa está por encima de 10 y, por lo tanto, ya no hay un problema de instrumento débil según la regla general de F> 10 de Stock y Yogo (2005). En este sentido, no veo cómo se supone que LIML es una solución para un problema de instrumento débil en el caso recién identificado. Observe también que i) LIML tiende a estar más disperso y requiere una corrección de sus errores estándar (ver Bekker, 1994) y ii) si su instrumento es realmente débil, no encontrará nada en la segunda etapa ni con 2SLS ni LIML porque los errores estándar serán demasiado grandes.

Andy
fuente
¡Gracias por la respuesta! Esto me hizo todo mucho más claro.
Elias