En el pasado, me han hecho una serie de preguntas relacionadas con artículos publicados en varias áreas donde se usan regresiones (y modelos relacionados, como modelos de panel o GLM) en datos de observación (es decir, datos no producidos por un experimento controlado , en muchos casos, pero no siempre, datos observados a lo largo del tiempo) pero donde no se intenta introducir variables instrumentales.
En respuesta, hice una serie de críticas (como describir problemas con sesgo cuando pueden faltar variables importantes), pero dado que otras personas aquí sin duda estarán mucho más informadas que yo sobre este tema, pensé en preguntar:
¿Cuáles son los principales problemas / consecuencias de tratar de llegar a conclusiones sobre las relaciones (particularmente, pero no limitadas a conclusiones causales) en tales situaciones?
¿Se puede hacer algo útil con estudios que se ajusten a tales modelos en ausencia de instrumentos?
¿Cuáles son algunas buenas referencias (libros o documentos) sobre los problemas con tal modelado (preferiblemente con una clara motivación no técnica de las consecuencias, ya que generalmente las personas que preguntan tienen una variedad de antecedentes, algunos sin muchas estadísticas) a los que las personas pueden referirse al criticar ¿un papel? La discusión de precauciones / problemas con los instrumentos también sería útil.
(Las referencias básicas sobre variables instrumentales están aquí , aunque si tiene alguna que agregar allí, eso también sería útil).
Los punteros a buenos ejemplos prácticos de búsqueda y uso de instrumentos serían una ventaja, pero no son fundamentales para esta pregunta.
[Probablemente apunte a otros a cualquier buena respuesta aquí a medida que me surjan esas preguntas. Puedo agregar uno o dos ejemplos a medida que los obtengo.]
fuente