¿Cómo se calcula la matriz de error var / cov mediante paquetes de análisis estadístico en la práctica?
Esta idea es clara para mí en teoría. Pero no en la práctica. Quiero decir, si tengo un vector de variables aleatorias , entiendo que la matriz de varianza / covarianza se le dará el producto externo de los vectores de desviación de la media: . Σ Σ = E [ ( X - E ( X ) ) ( X - E ( X ) ) ⊤ ]
Pero cuando tengo una muestra, los errores de mis observaciones no son variables aleatorias. O mejor, lo son, pero solo si tomo varias muestras idénticas de la misma población. De lo contrario, se les da. Entonces, nuevamente mi pregunta es: ¿cómo puede un paquete estadístico producir una matriz var / cov a partir de una lista de observaciones (es decir, una muestra) suministrada por el investigador?
fuente
Respuestas:
La matriz de covarianza para un modelo del tipo generalmente se calcula como donde es el suma residual de cuadrados, y son los grados de libertad (típicamente el número de observaciones menos el número de parámetros).( X t X ) - 1 σ 2y= Xβ+ ϵ σ2σ2=Σi(yi-Xi β )2d
Para errores estándar robustos o agrupados, el producto se modifica ligeramente. También puede haber otras formas de calcular la matriz de covarianza, por ejemplo, según lo sugerido por la expectativa de productos externos.XtX
fuente
Esto está incluido en Regresión práctica y Anova usando R por Julian J. Faraway, página 21 .
Ejemplo de su cálculo en R, basado en el modelo lineal de millas por galón regresión en múltiples especificaciones del modelo de coche incluidos en la
mtcars
base de datos:ols = lm(mpg ~ disp + drat + wt, mtcars)
. Estos son los cálculos manuales y la salida de lalm()
función:estimado como en la página 8 de este documento en línea como
fuente
fuente