Ahora tengo datos de un país africano sobre (i) niveles de corrupción en los sectores públicos y (ii) percepciones de la calidad del servicio de los hogares (malo, medio y alto). Los datos consisten en dos tipos de hogares: los que han utilizado los servicios públicos y los que NO.
He leído varios artículos de algunas revistas respetadas (World Development, Journal of Development Economics) que abordan el problema del sesgo de selectividad: aquellos que no se han dedicado a los servicios públicos podrían hacerlo porque sabían que tendrían que sobornar (corrupción) o tenían una mala experiencia del pasado y terminarían sintiéndose mal.
Sin embargo, los autores de los artículos no utilizan modelos de Heckit, que he aprendido de mi título. En cambio, argumentan que al ejecutar dos regresiones: (i) usar datos sobre aquellos que realmente usaron los servicios y (ii) todos los hogares de la muestra, independientemente del uso del servicio. Siento que este enfoque no es correcto.
Deseo comprender mejor cómo se debe manejar el sesgo de selección, particularmente en este ejemplo. Algunos problemas con los datos son que los datos pueden ser subjetivos, bastante pequeños (alrededor de 500 hogares) y propensos a errores de medición. ¿Tiene alguna sugerencia para lidiar con los problemas?
Muchas gracias.
fuente
Respuestas:
A lo que se refiere es a mínimos cuadrados de dos etapas. Esta es una variable instrumental comúnmente aplicada para corregir la endogenidad y el sesgo de selección. Es un tema bastante candente en economía en este momento y, cuando se aplica correctamente, puede ser muy útil y eliminará el sesgo de selección.
Hay algunas condiciones y suposiciones: suponga que desea estimar esta ecuación
Este es un candidato para 2SLS:
Otras lecturas:
Este ppt (Diapositiva 20 en adelante) describe un excelente (y muy famoso) ejemplo de IV.
Estas notas también son bastante sólidas.
Esta pregunta proporciona algunos libros de texto que también son muy útiles. Mi favorito personal es "Econometría mayormente inofensiva" de Angrist y Pischkes (escrito por el tipo que hizo el famoso ejemplo de ejemplo anterior) y "Análisis econométrico de datos de sección transversal y panel" de Wooldridge. Vale la pena señalar que ambos son libros de posgrado.
fuente