Comparación de residuos entre regresiones OLS y no OLS

9

Suponga que desea estimar un modelo lineal: ( observaciones de la respuesta y predictores ) nortepags+1

mi(yyo)=β0 0+j=1pagsβjXyoj

Una forma de hacerlo es a través de la solución OLS, es decir, elegir los coeficientes para que la suma de los errores cuadrados sea mínima:

(β0 0,β1,,βpags)T=argminβ0 0,β1,,βpagsyo=1norte(yyo-β0 0-j=1pagsβjXyoj)2

Alternativamente, podría usar otra función de pérdida, como la suma de las desviaciones absolutas, de modo que:

(β0 0,β1,,βpags)T=argminβ0 0,β1,,βpagsyo=1norteEl |yyo-β0 0-j=1pagsβjXyojEl |

Suponga que ha encontrado los parámetros para los dos modelos y desea elegir el modelo con el valor más pequeño de la función de pérdida. ¿Cómo puede comparar los valores mínimos alcanzados por las funciones de pérdida en general? (es decir, no solo este caso específico; también podríamos probar otras funciones de pérdida basadas en Lpags ) Parece haber una diferencia en la escala de las funciones: una trata con cuadrados mientras que la otra no.

Comp_Warrior
fuente
1
Bueno, los supuestos de Markov nos permiten mostrar que la primera ecuación es AZUL, o el mejor estimador imparcial lineal. En este caso, "Mejor" se determina teniendo los errores estándar más pequeños de todos los estimadores posibles. ¿No es esa una estadística adecuada?
gregmacfarlane
2
tenga en cuenta que y asíX2X1norteX2
argminβ0 0,β1,,βpagsyo=1norte(yyo-β0 0-j=1pagsβjXyoj)2argminβ0 0,β1,,βpagsyo=1norteEl |yyo-β0 0-j=1pagsβjXyojEl |(norte)argminβ0 0,β1,,βpagsyo=1norte(yyo-β0 0-j=1pagsβjXyoj)2
Manuel
1
@gmacfarlane Quiero definir "mejor" aquí en términos del valor mínimo de la función de pérdida, en lugar del error estándar en las estimaciones de los parámetros. (solo por curiosidad)
Comp_Warrior
2
Creo que no puede comparar los ajustes que provienen de 2 funciones de pérdida diferentes, porque son respuestas a diferentes preguntas. Una vez que decida que una función de pérdida dada es la adecuada para su situación, el ajuste se deriva de esa decisión. No puede doblarlo para validar la elección de la función de pérdida sin que esto se vuelva circular. Si tiene algún otro criterio por el que se puede comprender que ambas funciones de pérdida están abarcadas, puede usarlo, pero debe haberlo definido de antemano.
gung - Restablece a Monica
1
Tenga en cuenta que si el modelo para la expectativa era correcto y los tamaños de muestra eran lo suficientemente grandes como para que ambas estimaciones estuvieran efectivamente en el valor de la población, entonces la pregunta se convertiría efectivamente en "¿Cómo comparo una desviación media con una desviación estándar"? Bajo cualquier supuesto de distribución dado, podría comparar su tamaño esperado, pero, por supuesto, en pequeñas muestras, las estimaciones mismas difieren.
Glen_b -Reinstale a Mónica el

Respuestas:

4

(Convertir mi comentario en una respuesta)

Creo que no puede comparar los ajustes que provienen de diferentes funciones de pérdida, porque son respuestas a diferentes preguntas. Una vez que decida que una función de pérdida dada es la adecuada para su situación, el ajuste se deriva de esa decisión. No puede doblarlo para validar la elección de la función de pérdida sin que esto se vuelva circular. Si tiene algún otro criterio por el que se puede comprender que ambas funciones de pérdida están abarcadas, puede usarlo, pero debe haberlo definido de antemano.

gung - Restablece a Monica
fuente