Endogeneidad versus heterogeneidad no observada

13

¿Cuál es la diferencia entre endogeneidad y heterogeneidad no observada? Sé que la endogeneidad proviene, por ejemplo, de las variables omitidas? Pero hasta donde yo entiendo, la heterogeneidad no observada causa el mismo problema. Pero, ¿dónde está exactamente la diferencia entre estas dos nociones?

MarkDollar
fuente
la heterogeneidad no observada puede tener diferentes interpretaciones (por ejemplo, google no brinda una definición única), ¿puede citar alguna referencia o dar la definición precisa que desea que se le explique?
mpiktas
@mpiktas: estoy analizando el problema de las variables omitidas en una regresión. La omisión de variables causa problemas con la consistencia del estimador. Hay muchos otros problemas que causan inconsistencia (causalidad simultánea y errores de medición, por ejemplo). Todos estos problemas se conocen como endogenidad. Pero en este contexto a menudo escuchas la palabra heterogeneidad no observada. ¿Y no estoy seguro si este es un sinónimo de Endogenity? Lo siento, no puedo darte más información, porque no tengo ninguna (las referencias están en polaco, no lo entenderías :))
MarkDollar
3
pruébame, sé ruso, y las fórmulas son las mismas para todos los idiomas.
mpiktas

Respuestas:

13

Los términos endogeneidad y heterogeneidad no observada a menudo se refieren a lo mismo, pero el uso varía un poco, incluso dentro de la economía, la disciplina que más asocio con los términos.

En una ecuación de regresión, una variable explicativa es endógena. si está correlacionada con el término de error.

A menudo se describe que la endogeneidad tiene tres fuentes: variables omitidas, error de medición y simultaneidad. Aunque a menudo es útil mencionar estas "fuentes" por separado, a veces surge confusión porque no son realmente distintas. Imagine una regresión que predice el efecto de la educación en los salarios. Quizás nuestra medida de educación es simplemente la cantidad de años que alguien pasó en educación formal, independientemente del tipo de educación. Si tengo una idea clara de qué tipo de educación afecta los salarios, podría describir esta situación como un error de medición en la variable de educación. Alternativamente, podría describir la situación como un problema de variables omitidas (las variables que indican el tipo de educación).

Quizás los salarios también afectan las decisiones educativas. Si los salarios y la educación se miden al mismo tiempo, este es un ejemplo de simultaneidad, pero también podría reformularse en términos de variables omitidas.

La heterogeneidad no observada es simplemente variación / diferencias entre casos que no se miden. Si comprende la endogeneidad, creo que comprende las implicaciones de la heterogeneidad no observada en un contexto de regresión.

Michael Bishop
fuente
1
También incluiría la autorregresión con errores autocorrelacionados y la selección de muestras como formas adicionales de que pueda surgir la endogeneidad.
Dimitriy V. Masterov
1
@ DimitriyV.Masterov, gracias por mencionar esos conceptos, creo que extienden el punto que estaba haciendo. ¿No podría, por ejemplo, un caso dado de autorregresión con errores autocorrelacionados o selección de muestra como un problema de variables omitidas? Sé que no te estoy enseñando nada. Solo quiero que los alumnos piensen en cómo se relacionan estos términos y se den cuenta de que el mismo problema estadístico puede conceptualizarse de muchas maneras.
Michael Bishop
13

Estoy de acuerdo con la descripción de endogeneidad de @Michael: se trata de un problema con las variables que incluye y su relación con las variables que no incluye (es decir, las cosas en el término de error).

La heterogeneidad no observada generalmente se trata de componentes no observables de los efectos que está estimando. Continuando con el ejemplo educativo de @Michael, la heterogeneidad no observada podría ser que algunas personas tienen mayores ganancias (por ejemplo, aumentos en los salarios) de ir a la escuela que otras. Deje que los retornos para la persona sean β + b i con E ( b i ) = 0 . Tenemos y i = x i ( β + b i ) + w i γ + ϵ i , dondeiβ+biE(bi)=0

yi=xi(β+bi)+wyoγ+ϵyo,
es (típicamente, log) ingreso, x i es años de educación y w i es un conjunto de otros controles. Un ejemplo de endogeneidad es cuando x i está correlacionado con ϵ i (p. Ej., La educación está correlacionada con IQ, que no está entre nuestros otros predictores).yixiwixiϵi

yi=xiβ+wiγ+(ϵi+bxi)=xiβ+wiγ+ϵ~i
xiϵ~i
Charlie
fuente
3

Entiendo que la heterogeneidad es una diferencia entre los individuos. La heterogeneidad observada generalmente consiste en las covariables y la heterogeneidad no observada consiste en cualquier diferencia no observada como capacidad o esfuerzo.

La endogeneidad se refiere a la relación entre las variables observadas y no observadas, es decir, que dependen unas de otras.

dan
fuente
2

Para concluir:

  • La heterogeneidad no observada es una posible causa de endogeneidad.
  • La endogeneidad es, por lo tanto, el término más amplio.
  • La heterogeneidad no observada implica endogeneidad pero no al revés.
Petermeissner
fuente
2

La diferencia entre la heterogeneidad no observada y la endogenidad en el caso de las variables omitidas radica en los supuestos de ortogonalidad realizados. Mientras que en el primero, el supuesto es que la variable omitida no observada es independiente de la variable explicativa observada (incluida) x, ... en el segundo, este supuesto se relaja de tal manera que la variable no observada (omitida) se correlaciona con algunas de las observadas (incluido) variable explicativa.

jumens
fuente
-1

Respuesta fácil, sin explicación porque no se desea: si las variables omitidas que causan endogeneidad no son observables, la llamamos heterogeneidad no observada. Fácil :)

E. Brady
fuente