Estoy tratando de actualizar mi modelo basado en lm () para obtener errores y pruebas estándar correctos. Estoy realmente confundido qué matriz de VC usar. El sandwich
paquete ofrece vcovHC
, vcovHAC
y NeweyWest
. Mientras que el primero solo explica la heterocedasticidad, los dos últimos explican tanto la correlación serial como la heterocedasticidad. Sin embargo, la documentación no dice mucho sobre la diferencia entre los dos últimos (al menos no lo entiendo). Mirando a la función en sí, me di cuenta de que NeweyWest en realidad llama vcovHAC.
Empíricamente los resultados de coeftest(mymodel, vcov. = vcovHAC)
y coeftest(mymodel, vcov. = NeweyWest)
son muy diferentes. Si bien vcovHAC
está algo cerca de los resultados ingenuos de la película, usando NeweyWest todos los coeficientes se vuelven insignificantes (pruebas incluso cercanas a 1).
fuente
vcovHAC
se diferencia deNeweyWest
. Para resumir, los diferentes métodos HAC difieren solo en la elección de los pesos.NeweyWest
tiene sus pesos especificados,vcovHAC
es una función general, que le permite suministrar sus propios pesos, y por defecto usa los pesos Andrews.Respuestas:
El "emparedado" en cuestión son dos piezas de pan definidas por la información esperada que encierra una carne definida por la información observada. Vea mis comentarios aquí y aquí . Para una regresión lineal, la ecuación de estimación es:
La información esperada (pan) es:
La información observada (carne) es:
Tenga en cuenta que el término interno es una diagonal de residuos constantes cuando se cumple la suposición de datos independientes de homocedasticidad, entonces el estimador de covarianza intercalado que está dado por es la matriz de covarianza de regresión lineal usual donde es la varianza de los residuos. Sin embargo, eso es bastante estricto. Obtiene una clase de estimadores considerablemente más amplia al relajar los supuestos involucrados alrededor de la matriz residual : . σ 2 ( X T X ) - 1 σ 2 n × n R = ( Y - X T β ) ( Y - X T β )UNA- 1B A- 1 σ2( XTX )- 1 σ2 n × n
ElR
vcovHC
estimador "HC0" es consistente incluso cuando los datos no son independientes. Por lo tanto, no diré que "asumimos" que los residuos son independientes, pero diré que usamos "una estructura de covarianza independiente que funcione". Luego, la matriz se reemplaza por una diagonal de los residuosEste estimador funciona muy bien, excepto en muestras pequeñas (<40 a menudo se supone). Los HC1-3 son varias correcciones de muestras finitas. HC3 es generalmente el mejor desempeño.
Sin embargo, si hay efectos autorregresivos, las entradas fuera de la diagonal de no son cero, por lo que se produce una matriz de covarianza escalada basada en estructuras autorregresivas de uso común. Este es el fundamento de la "vcovHAC". Aquí, se producen métodos muy flexibles y generales para estimar el efecto autorregresivo: los detalles pueden estar más allá del alcance de su pregunta. La función "meatHAC" es el caballo de batalla general: el método predeterminado es Andrews. Newey-West es un caso especial del estimador de error autorregresivo general. Estos métodos resuelven uno de dos problemas: 1. a qué velocidad decae la correlación entre las observaciones "adyacentes" y 2. ¿cuál es una distancia razonable entre dos observaciones? Si tiene datos de panel equilibrados, este estimador de covarianza es excesivo.T
gee
gee
paquete en lugar de especificar la estructura de covarianzaAR-1
o similar.En cuanto a cuál usar, depende de la naturaleza del análisis de datos y de la pregunta científica. No recomendaría ajustar todos los tipos y elegir el que se vea mejor, ya que es un problema de prueba múltiple. Como mencioné anteriormente, el estimador de vcovHC es consistente incluso en presencia de un efecto autorregresivo, por lo que puede usar y justificar un "modelo de correlación de independencia de trabajo" en una variedad de circunstancias.
fuente