Según tengo entendido, estoy interesado en replicar manualmente el cálculo de los errores estándar de los coeficientes estimados ya que, por ejemplo, viene con el resultado de la lm()
función R
, pero no he podido precisarlo. ¿Cuál es la fórmula / implementación utilizada?
114
Respuestas:
El modelo lineal se escribe como donde denota el vector de respuestas, es el vector de los parámetros de efectos fijos, es la matriz de diseño correspondiente cuyas columnas son los valores de las variables explicativas, y es el vector de errores aleatorios.
Es bien sabido que una estimación de viene dada por (consulte, por ejemplo, el artículo de Wikipedia ) Por lo tanto, [recordatorio: , para algunos vectores aleatorios y algunas matrices no aleatorias ]β
para que donde se puede obtener por el error cuadrático medio (MSE) en la tabla ANOVA.
Ejemplo con una regresión lineal simple en R
Cuando hay una sola variable explicativa, el modelo se reduce a y para que y las fórmulas se vuelven más transparentes. Por ejemplo, el error estándar de la pendiente estimada es
fuente
lm.fit
/summary.lm
es un poco diferente, para la estabilidad y la eficiencia ...Las fórmulas para estos se pueden encontrar en cualquier texto intermedio sobre estadísticas, en particular, puede encontrarlas en Sheather (2009, Capítulo 5) , de donde también se toma el siguiente ejercicio (página 138).
El siguiente código R calcula las estimaciones de coeficientes y sus errores estándar manualmente
que produce la salida
Compare con la salida de
lm()
:que produce la salida:
fuente
solve()
función. Esto sería bastante más largo sin el álgebra matricial. ¿Hay una manera sucinta de realizar esa línea específica con solo operadores básicos?Parte de la respuesta de Ocram es incorrecta. Realmente:
Y el comentario de la primera respuesta muestra que se necesita más explicación de la varianza del coeficiente:
Editar
Gracias, ignoré el sombrero en esa beta. La deducción anterior es . El resultado correcto es:wrongly wrong
1.(Para obtener esta ecuación, establezca la derivada de primer orden de en igual a cero, para maximizar )β^=(X′X)−1X′y. SSR β SSR
2.E(β^|X)=E((X′X)−1X′(Xβ+ϵ)|X)=β+((X′X)−1X′)E(ϵ|X)=β.
3.Var(β^)=E(β^−E(β^|X))2=Var((X′X)−1X′ϵ)=(X′X)−1X′σ2IX(X′X)−1=σ2(X′X)−1
Espero que ayude.
fuente