Un error estándar es la desviación estándar estimada de un estimador para un parámetro . θ θ
¿Por qué la desviación estándar estimada de los residuos se denomina "error estándar residual" (por ejemplo, en la salida de la summary.lm
función de R ) y no "desviación estándar residual"? ¿Qué parámetro de estimación equipamos aquí con un error estándar?
¿Consideramos cada residuo como un estimador para "su" término de error y estimamos el error estándar "agrupado" de todos estos estimadores?
r
standard-error
residuals
terminology
Michael M
fuente
fuente
Respuestas:
Creo que el fraseo es específico de la
summary.lm()
salida de R. Observe que el valor subyacente en realidad se llama "sigma" (summary.lm()$sigma
). No creo que otro software necesariamente use ese nombre para la desviación estándar de los residuos. Además, la frase "desviación estándar residual" es común en los libros de texto, por ejemplo. No sé cómo llegó a ser el fraseo utilizado en lasummary.lm()
salida de R , pero siempre pensé que era extraño.fuente
summary.lm(reg)$sigma
diferente desd(reg$residuals)
?stats::sigma
: El nombre erróneo "Error estándar residual" ha sido parte de demasiadas salidas R (y S) para poder cambiarlas fácilmente allí.Desde mi formación en econometría, se llama "error estándar residual" porque es una estimación de la "desviación estándar residual" real. Vea esta pregunta relacionada que corrobora esta terminología.
Una búsqueda en Google del término error estándar residual también muestra muchos resultados, por lo que no es una rareza. Intenté ambos términos con citas, y ambos aparecen aproximadamente 60,000 veces.
fuente
Error estándar - Wikipedia, la enciclopedia libre
fuente
Un modelo de regresión ajustado utiliza los parámetros para generar predicciones de estimación puntual que son el medio de las respuestas observadas si tuviera que replicar el estudio con los mismos valores XX un número infinito de veces ( cuando el modelo lineal es verdadero ).
La diferencia entre estos valores pronosticados y los utilizados para ajustar el modelo se denominan " Residuos " que, al replicar el proceso de recopilación de datos, tienen propiedades de variables aleatorias con 0 medias. Los residuos observados se utilizan para estimar posteriormente la variabilidad en estos valores y para estimar la distribución de muestreo de los parámetros.
Nota:
Cuando el error estándar residual es exactamente 0, el modelo se ajusta perfectamente a los datos (probablemente debido al sobreajuste).
Si no se puede demostrar que el error estándar residual sea significativamente diferente de la variabilidad en la respuesta incondicional, entonces hay poca evidencia que sugiera que el modelo lineal tenga alguna capacidad predictiva.
fuente