En el método de mínimos cuadrados queremos estimar los parámetros desconocidos en el modelo:
Una vez que hayamos hecho eso (para algunos valores observados), obtenemos la línea de regresión ajustada:
Ahora, obviamente, queremos verificar algunas parcelas para asegurarnos de que se cumplen los supuestos. Supongamos que desea verificar la homocedasticidad, sin embargo, para hacer esto, en realidad estamos verificando los residuos . Digamos que examina el gráfico de valores residuales vs predichos, si eso nos muestra que la heterocedasticidad es aparente, entonces, ¿cómo se relaciona eso con el término de perturbación ε j ? ¿La heteroscedasticidad en los residuos implica heteroscedasticidad en términos de perturbación?
La relación entre ε y ε es:ε^ ε
donde , la matriz de sombrero, es X ( X T X ) - 1 X T .H X( XTX)- 1XT
Lo que quiere decir que ε i es una combinación lineal de todos los errores, pero por lo general la mayor parte del peso recae en la que uno -ésimo.ε^yo yo
Aquí hay un ejemplo, usando el
cars
conjunto de datos en R. Considere el punto marcado en púrpura:Podemos reescribir eso como:
o más generalmente
Es decir, en regresiones con buen comportamiento, los residuos pueden tratarse principalmente como una estimación moderadamente ruidosa de no observable el término de error. A medida que consideramos los puntos más alejados del centro, las cosas funcionan un poco menos bien (el residuo se pondera menos en el error y los pesos en los otros errores se vuelven menos uniformes).
fuente