¿Cuál es la diferencia entre endogeneidad y heterogeneidad no observada? Sé que la endogeneidad proviene, por ejemplo, de las variables omitidas? Pero hasta donde yo entiendo, la heterogeneidad no observada causa el mismo problema. Pero, ¿dónde está exactamente la diferencia entre estas dos nociones?
regression
assumptions
MarkDollar
fuente
fuente
Respuestas:
Los términos endogeneidad y heterogeneidad no observada a menudo se refieren a lo mismo, pero el uso varía un poco, incluso dentro de la economía, la disciplina que más asocio con los términos.
En una ecuación de regresión, una variable explicativa es endógena. si está correlacionada con el término de error.
A menudo se describe que la endogeneidad tiene tres fuentes: variables omitidas, error de medición y simultaneidad. Aunque a menudo es útil mencionar estas "fuentes" por separado, a veces surge confusión porque no son realmente distintas. Imagine una regresión que predice el efecto de la educación en los salarios. Quizás nuestra medida de educación es simplemente la cantidad de años que alguien pasó en educación formal, independientemente del tipo de educación. Si tengo una idea clara de qué tipo de educación afecta los salarios, podría describir esta situación como un error de medición en la variable de educación. Alternativamente, podría describir la situación como un problema de variables omitidas (las variables que indican el tipo de educación).
Quizás los salarios también afectan las decisiones educativas. Si los salarios y la educación se miden al mismo tiempo, este es un ejemplo de simultaneidad, pero también podría reformularse en términos de variables omitidas.
La heterogeneidad no observada es simplemente variación / diferencias entre casos que no se miden. Si comprende la endogeneidad, creo que comprende las implicaciones de la heterogeneidad no observada en un contexto de regresión.
fuente
Estoy de acuerdo con la descripción de endogeneidad de @Michael: se trata de un problema con las variables que incluye y su relación con las variables que no incluye (es decir, las cosas en el término de error).
La heterogeneidad no observada generalmente se trata de componentes no observables de los efectos que está estimando. Continuando con el ejemplo educativo de @Michael, la heterogeneidad no observada podría ser que algunas personas tienen mayores ganancias (por ejemplo, aumentos en los salarios) de ir a la escuela que otras. Deje que los retornos para la persona sean β + b i con E ( b i ) = 0 . Tenemos y i = x i ( β + b i ) + w ′ i γ + ϵ i , dondei β+bi E(bi)=0
fuente
Entiendo que la heterogeneidad es una diferencia entre los individuos. La heterogeneidad observada generalmente consiste en las covariables y la heterogeneidad no observada consiste en cualquier diferencia no observada como capacidad o esfuerzo.
La endogeneidad se refiere a la relación entre las variables observadas y no observadas, es decir, que dependen unas de otras.
fuente
Para concluir:
fuente
La diferencia entre la heterogeneidad no observada y la endogenidad en el caso de las variables omitidas radica en los supuestos de ortogonalidad realizados. Mientras que en el primero, el supuesto es que la variable omitida no observada es independiente de la variable explicativa observada (incluida) x, ... en el segundo, este supuesto se relaja de tal manera que la variable no observada (omitida) se correlaciona con algunas de las observadas (incluido) variable explicativa.
fuente
Respuesta fácil, sin explicación porque no se desea: si las variables omitidas que causan endogeneidad no son observables, la llamamos heterogeneidad no observada. Fácil :)
fuente