De una Introducción al aprendizaje estadístico de James et al., La estimación de validación cruzada de dejar uno fuera (LOOCV) se define por
donde.
Sin prueba, la ecuación (5.2) establece que para una regresión de mínimos cuadrados o polinomios (si esto se aplica a la regresión en una sola variable es desconocida para mí),
donde "Yies eliº valor ajustado del original ajuste por mínimos cuadrados (ni idea de lo que esto significa, por cierto, significa el uso detodo? De los puntos en el conjunto de datos) yhies el apalancamiento "que se define porhi=1
¿Cómo se prueba esto?
Mi intento: uno podría empezar por notando que y i = β 0 + k Σ i = 1 β k X k + algunos términos polinomio de grado ≥ 2 , pero aparte de esto (y si recuerdo, que la fórmula para h i es de sólo cierto para la regresión lineal simple ...), no estoy seguro de cómo proceder desde aquí.
regression
self-study
cross-validation
least-squares
Clarinetista
fuente
fuente
Respuestas:
Mostraré el resultado para cualquier regresión lineal múltiple, ya sea que los regresores sean polinomios de o no. De hecho, muestra un poco más de lo que solicitó, porque muestra que cada residuo de LOOCV es idéntico al residual ponderado por apalancamiento correspondiente de la regresión completa, no solo que puede obtener el error de LOOCV como en (5.2) (hay podrían ser otras formas en que los promedios están de acuerdo, incluso si no cada término en el promedio es el mismo).Xt
Permítanme tomar la libertad de usar notación ligeramente adaptada.
Se demuestra en primer lugar que β donde β es la estimación utilizando todos los datos y β (t)la estimación cuando dejando deX(t), la observaciónt. DejeXtser definido como un vector fila de tal manera que y t=Xt β . U tson los residuos.
La prueba utiliza el siguiente resultado algebraico matricial.
Sea una matriz no singular, b un vector y λ un escalar. Si λA b λ Entonces
(A+λbb′)-1
El siguiente resultado es útil para probar (A)
The proof of (A) now follows from (C): As
Now, noteht=Xt(X′X)−1X′t . Multiply through in (A) by Xt , add yt on both sides and rearrange to get, with u^(t) the residuals resulting from using β^(t) (yt−Xtβ^(t) ),
fuente