¿Cuál es la diferencia entre errores y residuos?

Respuestas:

20

Los errores pertenecen al verdadero proceso de generación de datos (DGP), mientras que los residuos son lo que queda después de haber estimado su modelo. En verdad, supuestos como la normalidad, la homocedasticidad y la independencia se aplican a los errores del DGP, no a los residuos de su modelo. (Por ejemplo, al ajustar losparámetros deen su modelo, solo losresiduospueden ser independientes). Sin embargo, solo tenemos acceso a los residuos, así que con eso trabajamos. pag+1norte-(pag+1)

gung - Restablece a Monica
fuente
99
(+1) Los residuos pueden considerarse estimaciones de los errores.
Scortchi - Restablece a Monica
@ABC, DGPsignifica proceso de generación de datos . Incluso si su modelo es apropiado y refleja la verdadera estructura de la DGP, los residuos no serán necesariamente normales, homoscedasticos e independientes si los errores subyacentes no lo fueran.
gung - Restablece a Monica
@Scortchi Hola, ¿tienes referencias que se expanden en tu comentario? Estoy tratando de entender por qué se pueden usar exactamente los residuos como estimaciones del error, porque veo personas que comprueban la normalidad de los residuos en el análisis de regresión cuando el supuesto real es la normalidad del error, y no sé exactamente por qué eso es válido.
Austin
@ Austin, si todavía estás interesado en eso, debes hacer una nueva pregunta.
gung - Reinstalar a Monica
13

Un error es la diferencia entre el valor observado y el valor verdadero (muy a menudo no observado, generado por el DGP).

Un residual es la diferencia entre el valor observado y el valor predicho (según el modelo).

Leopold W.
fuente
±
Este enlace ( ece.rochester.edu/courses/ECE111/error_uncertainty.pdf ) proporciona una buena explicación con referencias a los textos de Bevington y Taylor sobre el tema.
Steven C. Howell el
En el lenguaje de aprendizaje automático, ¿el residuo es el error de entrenamiento y el error es el error de prueba?
Charles Chow
@CharlesChow Depende del conjunto de datos que use. Si usa el conjunto de entrenamiento, entonces es un error de entrenamiento; si usa un conjunto de prueba, entonces es un error de prueba.
Leopold W.
7

El término de error es un concepto teórico que nunca se puede observar, pero el residual es un valor del mundo real que se calcula cada vez que se realiza una regresión

Kudzai Lemiel Munyukwa
fuente