MCO: en la primera ecuación sesga los errores estándar en la segunda ecuación?

8

Supongamos que son series de tiempo con , ( y es similar a la de , pero cambia cuando el dummy = 1). y , . En un entorno real, esto será un rendimiento periódico del mercado de valores sobre empresas (pero puede ignorar esto). Hay un ficticio, que es igual a la unidad sobre e igual a cero en caso contrario. El modelo de serie temporal que se estimará con OLS es:Xit,YitXitN(0.1,1)σ2(Yit)=1mean(Yit)Xitt{1,2,...,200}i{1,2,...,N}NDtt{150,151,...,200}i

(1)Yit=αi+βiXit+γiDt+ϵit

Este modelo generalmente se adhiere a los supuestos de Gauss-Markov para cada . Sin embargo, tenemos para todos los y .iE[ϵitTϵjt]0ij

El siguiente paso es construir un vector de gammas usando las estimaciones del modelo . Llame a este vector . Luego usamos esto en el modelo de sección transversal:N(1)γ^

(2)γ^i=a+bZi+ui

donde es una variable de sección transversal que no causa ninguna violación en los supuestos de OLS y es relevante para explicar .Ziγ^i


La afirmación en la literatura de econometría aplicada es que en el modelo conduce a (i) No hay problema para las estimaciones del coeficiente MCO en , pero (ii) Errores estándar sesgados en .E[ϵitTϵjt]0(1)(2)(2)

  • ¿Alguien puede publicar ideas sobre por qué este es el caso?

  • No entiendo qué está en la expresión . Por supuesto, es un escalar y no se puede transponer un escalar. Esto se ve AQUÍ , donde aplican esta metodología.ϵitTE[ϵitTϵjt]0ϵit


fuente
1
Dices que no entiendes por qué las estimaciones de varianza están sesgadas en la ecuación 2 y luego dices que podemos ignorar tu estimación que resulta ser la ecuación 2. Creo que entiendo a qué te refieres y podría darte una respuesta especulativa, pero será mejor para ti precisar tu pregunta. γ
JDav
1
En su configuración, no puede ser estacionario, ya que su media depende de . Yitt
mpiktas
Hay tres versiones de la expectativa (una en el título, otra en el cuerpo y una tercera en los comentarios). Todos ellos incorporan una misteriosa transposición, aunque en todos los casos solo están presentes escalares. ¿Te importa editar tu publicación para aclarar?
cardenal
@mpiktas Observación correcta, tiene una media diferente después de (dado ). Gracias. Yitt=150γi0
Se han entregado algunas buenas respuestas, solo agregaría que esto debe estimarse como un modelo de coeficientes aleatorios (también conocido como modelo multinivel para sociólogos y psicólogos, también conocido como modelo mixto para bioestadísticos). Si los economistas no saben esto y lo estiman con un procedimiento de dos pasos, eso es demasiado malo para ellos (y todavía estoy esperando que mueran los errores estándar de Fama-Macbeth, que aparentemente no quieren hacer).
StasK

Respuestas:

3

Para asegurarse de que necesita entrar en los detalles, esto implica comparar la matriz de covarianza de varianza verdadera con la que obtiene en la segunda etapa de ols.

El verdadero :

Esto puede obtenerse reemplazando eq.2 en eq.1, sigue el OLS agrupado y, a partir de él, la verdadera matriz de covarianza de varianza :a^,b^

Yit=αi+βiXit+aDt+bDtZi+Dtui+ϵit

Usar la notación matricial para dividir la ecuación en parámetros y otros conduce a:γ

Y=Xθ+Zγ+ε

donde estamos interesados ​​en , , Z es un vector de dos columnas (una estructura similar define X pero esto no es de interés) y donde tiene un estructura completa de covarianzas entre empresas, por eso no es diagonal ( ) como en los supuestos de GAUSS-MARKOV. Por Frish-Waugh podemos expresar ols como:V(γ^)γ=[ab]Z=[DtDtZi][i=1,..,N;t=1,...,T]V(ε)=Σσ2INTγ

γ^=(ZMXZ)1ZMXY dondeMX=IX(XX)1X

lo que implica la siguiente varianza verdadera:

V(γ^)=HΣH dondeH=(ZMXZ)1ZMX

El otro

Bajo el supuesto de empresas no correlacionadas (y períodos de tiempo pero este no es el problema), tiene una estructura diagonal más simple . Esto significa que los términos triangulares son 0. Bajo una especificación aún más simple (la que se estima por defecto por software econométrico y estadístico para OLS) sigue las suposiciones de GAUSS-Markov, lo que significa que incluso los términos diagonales son iguales por lo tanto está degradado aΣΔΔΣΣσ2I

Esto implica que no considerar la correlación entre empresas conduciría a como:V(γ^)

V(γ^)=HΔH oV(γ^)=Hσ2IHσ2(ZMxZ)1

que, como se puede ver, no son iguales al verdadero.

JDav
fuente
Con palabras diferentes ... Básicamente estoy dando la misma respuesta que @mpiktas dio
JDav
(1) Realmente fantástico. (2) ¿Parece que ha ignorado cuando expresó el modelo en forma de matriz? Sin embargo, esto no debería cambiar nada de lo que has hecho. (3) ¿Sabría por qué el Portafolio OLS proporciona los SE correctos? (Ver el artículo de 1986 que vinculé). No te molestes con la respuesta (3) si no te gustaría resolver ese problema. Diui
(2) No puse todas las definiciones para dejar algo de intuición y evitar los productos kronecker ... de esta manera la demostración va "más rápido". Pero puede deducir que el nuevo término aleatorio es , esto significa que si las empresas se correlacionaron con , esto hace que el nuevo término aleatorio se correlacione en su dimensión de las empresas también. (3) no escuché sobre un OLS de cartera, pero supongo que es solo un nombre más para algo que ya existe en la econometría estándar para εit=Dtui+ϵituiεit
eliminar
(3) una buena estimación implica una buena estimación de , la cartera OLS de alguna manera está estimando la estructura completa y no solo las variaciones sin covarianzas: o una sola variación:ΣΣΔσ2
JDav
2
Creo que la notación es inexacta, usa escalares donde se necesitan vectores para referirse al hecho de que las covarianzas entre empresas no son cero, por lo que su notación implica es un vector de N filas. Otra interpretación es que se está refiriendo al elemento de . En ambos casos quiere decir lo mismo, pero como no es un diario cuantitativo, ocurren ambigüedades en notación matemática ...ϵit=[ϵit]i=1,...,Nijϵ.tTϵ.t
JDav
2

Estoy poniendo otra respuesta con más detalles.

En el modelo de regresión lineal estándar (en forma de matriz):

Y=Xβ+ε

la estimación de OLS es la siguiente

β^=(XTX)1XTY.

Su varianza entonces es

Var(β^)=(XTX)1XTVar(Y)X(XTX)1.

La suposición habitual para la regresión es que

Var(Y)=σ2I,

donde es la matriz de identidad. EntoncesI

Var(β^)=σ2(XTX)1.

Ahora en tu caso tienes dos modelos:

Yi=Miδi+ϵi

y

Γ=Lc+u,

dónde

  • YiT=(Yi1,...,YiT) ,
  • Mi=[1,Xi,D] , con ,XiT=(Xi1,...,XiT)DT=(D1,...,DT)
  • δiT=(αi,βi,γi)
  • ϵiT=(ϵi1,...,ϵiT)
  • ΓT=(γ1,...,γn)
  • L=[1,Z] , conZT=(Z1,...,Zn)
  • cT=(a,b)
  • uT=(u1,...,uN) .

Tenga en cuenta que establece el segundo modelo para las estimaciones de , que no es habitual, por lo tanto, lo reformulo en forma habitual, para el "verdadero" .γγ

Anotemos la matriz de covarianza para las estimaciones OLS de coeficientes :c

Var(c^)=(LTL)1LTVar(Γ)L(LTL)1

El problema es que no observamos . Observamos las estimaciones . es parte del vectorΓΓ^γ^i

δ^i=δi+(MiTMi)1MiTϵi.

Suponga que es aleatorio e independiente con y . Esto seguramente es válido para por lo que no perdemos nada si lo ampliamos para otros elementos de .δiϵiMiγiδi

Apilemos todos uno encima del otro:δ^i

δ^T=[δ1T,...,δNT]

y explore la varianza de :δ^

Var(δ^)=[Var(δ^1)cov(δ^1,δ^2)cov(δ^1,δ^N)cov(δ^n,δ^1)cov(δ^n,δ2)Var(δ^N)]

Suponga que y que . Para tenemosVar(ϵi)=σϵ2IEϵiϵjT=0ij

cov(δ^i,δ^j)=cov(δi,δj)+cov((MiTMi)1MiTϵi,(MjTMj)1MjTϵj)=(MiTMi)1MiTE(ϵiϵjT)Mj(MjTMj)1=0

Para elementos diagonales tenemos

Var(δ^i)=Var(δi)+σϵ2(MiTMi)1

Volvamos a la varianza de . Como sustituimos lugar de la varianza es la siguientec^Γ^Γ

Var(c^)=(LTL)1LTVar(Γ^)L(LTL)1,

Podemos extraer de seleccionando los elementos apropiados:Var(Γ^)Var(δ^)

Var(Γ^)=Var(Γ)+diag(g1,...,gn)

donde es el elemento de correspondiente a . Cada es diferente de ya que corresponden a diferentes y que no se supone que sean iguales.giσϵ2(MiTMi)1Var(γ^i)gigjXitXjt

Entonces obtenemos el sorprendente resultado, que algebraicamente, incluso si asumimos todas las propiedades necesarias, la matriz de covarianza resultante, al menos algebraicamente, no será igual a la matriz de covarianza OLS habitual, ya que para eso necesitamos que sea ​​constante veces matriz de identidad que claramente no lo es.Var(Γ^)

Todas las fórmulas anteriores se derivaron suponiendo que son constantes, por lo que están condicionadas a . Esto significa que en realidad calculamos . Al poner suposiciones adicionales en , creo que sería posible mostrar que la varianza incondicional está bien.XijXijVar(Γ^|X)Xij

El supuesto de independencia colocado en también se puede relajar a la falta de correlación. ϵi

También sería posible usar el estudio de simulación para ver cómo difieren las matrices de covarianza si usamos lugar de .Γ^Γ

mpiktas
fuente
1

Creo que el problema radica en la definición del segundo modelo. Creo que se supone que

γi=a+bZi+ui

con la suposición habitual de que

cov(γi,γj|Z1,...,ZN)=0,

es decir, que no están correlacionados si controlamos para . Ahora, cuando sustituye lugar de , debe verificar si el supuesto se cumple, es decir, siγiZiγ^γ

cov(γi^,γ^j|Zi)=0.

Ahora

γ^i=γi+L(ϵit),

donde es alguna función lineal. Es seguro asumir que es independiente de , pero si , la suposición necesaria no se cumple.LϵitZiEϵitϵjt0

Dado que el supuesto de falta de correlación es fundamental para el cálculo de las estadísticas OLS habituales, esto da la razón por la cual los errores estándar están sesgados.

Este fue un esbozo, pero creo que la idea debería funcionar si entras en detalles esenciales de la maquinaria OLS.

mpiktas
fuente