Enfoque de función de control y Bootstrap

8

Comencemos asumiendo que tengo datos de sección transversal en , x_1 , x_2 (ver abajo para y , x_1 , x_2 ).yx1x2yx1x2

Quiero estimar el efecto de las variables x1 y x2 y su interacción ( x3=x1x2 ) en la variable y utilizando el enfoque de la función de control, y es muy probable que x1 y x2 sean endógenas. Tengo dos instrumentos, z1 y z2 . Estimo las siguientes dos ecuaciones de la primera etapa y guardo los residuos pronosticados de la siguiente manera:

ivreg2 x1 z1 z2 
predict error1hat, residuals
ivreg2 x2 z1 z2 
predict error2hat, residuals

Una vez que guardo los residuos pronosticados, calculo la ecuación de la segunda etapa de la siguiente manera:

ivreg2 y x1 x2 x3 error1hat error2hat 

Aunque los coeficientes estimados de x1 , x2 y x3 tienen sentido, sé que los errores estándar no están bien (consulte la página 8 de http://eml.berkeley.edu/~train/petrintrain.pdf ).

En la página 8 de http://eml.berkeley.edu/~train/petrintrain.pdf , los autores sugieren utilizar el bootstrap para obtener errores estándar corregidos para x1 , x2 y x3 .

Mis preguntas son :

  1. ¿Cómo debo configurar el bootstrap?
  2. ¿Se aplica el bootstrap solo a la ecuación de la segunda etapa, o se aplica tanto a la ecuación de la primera etapa como a la de la segunda etapa?

Ahora, supongamos que tengo datos de panel en , y . Primero, uso la diferencia dentro del grupo para eliminar la heterogeneidad no observada, luego calculo los parámetros usando el enfoque de la función de control como si los datos fueran datos de sección transversal (ver arriba). ¿Debo hacer algunos ajustes adicionales en el caso de que use datos del panel con respecto al caso que se muestra arriba?yx1x2

Mark Vitale-Ferrari
fuente

Respuestas:

3

Cameron y Trivedi - Microeconometrics usando Stata discuten diferentes técnicas de arranque y muestran los archivos de código Stata, por ejemplo, para el estimador de dos pasos de Heckman.

Con respecto a la pregunta 2.: El bootstrap se aplica tanto a la ecuación de la primera etapa como a la segunda. También puede arrancar solo la segunda etapa, pero luego debe hacer suposiciones adicionales sobre la distribución de sus variables predichas (arranque paramétrico). Dicho esto, es mucho más simple hacer el arranque en dos etapas.

Con respecto a la pregunta 1.:

Puede encontrar ejemplos de código (en Stata) para diferentes ejemplos aquí (2SLS) o aquí (Heckman)

Aquí también hay una pequeña descripción general que es gratuita y analiza algunos de los temas que también puede encontrar en el libro de Cameron y Trivedi.

Tengo que decir que creo que el tema a menudo es confuso, en particular si tiene varias primeras etapas, también tengo una pregunta abierta aquí , pero sin respuestas.

Actualización: Lo siento, olvidé comentar sobre el caso de los datos del panel. En este caso, usaría un error estándar robusto del clúster en cada etapa del arranque de dos etapas.

PD: Stata tiene un archivo de ayuda bastante elaborado sobre bootstrapping, también deberías comprobarlo.

Arne Jonas Warnke
fuente