Supongamos que son series de tiempo con , ( y es similar a la de , pero cambia cuando el dummy = 1). y , . En un entorno real, esto será un rendimiento periódico del mercado de valores sobre empresas (pero puede ignorar esto). Hay un ficticio, que es igual a la unidad sobre e igual a cero en caso contrario. El modelo de serie temporal que se estimará con OLS es:
Este modelo generalmente se adhiere a los supuestos de Gauss-Markov para cada . Sin embargo, tenemos para todos los y .
El siguiente paso es construir un vector de gammas usando las estimaciones del modelo . Llame a este vector . Luego usamos esto en el modelo de sección transversal:
donde es una variable de sección transversal que no causa ninguna violación en los supuestos de OLS y es relevante para explicar .
La afirmación en la literatura de econometría aplicada es que en el modelo conduce a (i) No hay problema para las estimaciones del coeficiente MCO en , pero (ii) Errores estándar sesgados en .
¿Alguien puede publicar ideas sobre por qué este es el caso?
No entiendo qué está en la expresión . Por supuesto, es un escalar y no se puede transponer un escalar. Esto se ve AQUÍ , donde aplican esta metodología.
Respuestas:
Para asegurarse de que necesita entrar en los detalles, esto implica comparar la matriz de covarianza de varianza verdadera con la que obtiene en la segunda etapa de ols.
El verdadero :
Esto puede obtenerse reemplazando eq.2 en eq.1, sigue el OLS agrupado y, a partir de él, la verdadera matriz de covarianza de varianza :una^,si^
Usar la notación matricial para dividir la ecuación en parámetros y otros conduce a:γ
donde estamos interesados en , , Z es un vector de dos columnas (una estructura similar define X pero esto no es de interés) y donde tiene un estructura completa de covarianzas entre empresas, por eso no es diagonal ( ) como en los supuestos de GAUSS-MARKOV. Por Frish-Waugh podemos expresar ols como:V(γ^) γ= [ ab ] Z= [retretZyo][ I = 1 , . . , N; t = 1 , . . . , T] V( ε ) = Σ σ2yonorteT γ
lo que implica la siguiente varianza verdadera:
El otro
Bajo el supuesto de empresas no correlacionadas (y períodos de tiempo pero este no es el problema), tiene una estructura diagonal más simple . Esto significa que los términos triangulares son 0. Bajo una especificación aún más simple (la que se estima por defecto por software econométrico y estadístico para OLS) sigue las suposiciones de GAUSS-Markov, lo que significa que incluso los términos diagonales son iguales por lo tanto está degradado aΣ Δ Δ Σ Σ σ2yo
Esto implica que no considerar la correlación entre empresas conduciría a como:V(γ^)
que, como se puede ver, no son iguales al verdadero.
fuente
Estoy poniendo otra respuesta con más detalles.
En el modelo de regresión lineal estándar (en forma de matriz):
la estimación de OLS es la siguiente
Su varianza entonces es
La suposición habitual para la regresión es que
donde es la matriz de identidad. EntoncesI
Ahora en tu caso tienes dos modelos:
y
dónde
Tenga en cuenta que establece el segundo modelo para las estimaciones de , que no es habitual, por lo tanto, lo reformulo en forma habitual, para el "verdadero" .γ γ
Anotemos la matriz de covarianza para las estimaciones OLS de coeficientes :c
El problema es que no observamos . Observamos las estimaciones . es parte del vectorΓ Γ^ γ^i
Suponga que es aleatorio e independiente con y . Esto seguramente es válido para por lo que no perdemos nada si lo ampliamos para otros elementos de .δi ϵi Mi γi δi
Apilemos todos uno encima del otro:δ^i
y explore la varianza de :δ^
Suponga que y que . Para tenemosVar(ϵi)=σ2ϵI EϵiϵTj=0 i≠j
Para elementos diagonales tenemos
Volvamos a la varianza de . Como sustituimos lugar de la varianza es la siguientec^ Γ^ Γ
Podemos extraer de seleccionando los elementos apropiados:Var(Γ^) Var(δ^)
donde es el elemento de correspondiente a . Cada es diferente de ya que corresponden a diferentes y que no se supone que sean iguales.gi σ2ϵ(MTiMi)−1 Var(γ^i) gi gj Xit Xjt
Entonces obtenemos el sorprendente resultado, que algebraicamente, incluso si asumimos todas las propiedades necesarias, la matriz de covarianza resultante, al menos algebraicamente, no será igual a la matriz de covarianza OLS habitual, ya que para eso necesitamos que sea constante veces matriz de identidad que claramente no lo es.Var(Γ^)
Todas las fórmulas anteriores se derivaron suponiendo que son constantes, por lo que están condicionadas a . Esto significa que en realidad calculamos . Al poner suposiciones adicionales en , creo que sería posible mostrar que la varianza incondicional está bien.Xij Xij Var(Γ^|X) Xij
El supuesto de independencia colocado en también se puede relajar a la falta de correlación.ϵi
También sería posible usar el estudio de simulación para ver cómo difieren las matrices de covarianza si usamos lugar de .Γ^ Γ
fuente
Creo que el problema radica en la definición del segundo modelo. Creo que se supone que
con la suposición habitual de que
es decir, que no están correlacionados si controlamos para . Ahora, cuando sustituye lugar de , debe verificar si el supuesto se cumple, es decir, siγi Zi γ^ γ
Ahora
donde es alguna función lineal. Es seguro asumir que es independiente de , pero si , la suposición necesaria no se cumple.L ϵit Zi Eϵitϵjt≠0
Dado que el supuesto de falta de correlación es fundamental para el cálculo de las estadísticas OLS habituales, esto da la razón por la cual los errores estándar están sesgados.
Este fue un esbozo, pero creo que la idea debería funcionar si entras en detalles esenciales de la maquinaria OLS.
fuente