En el capítulo 5.5 de este libro , discuten cómo surgen muchos de estos criterios de selección de modelos. Comienzan con el criterio FPE de Akaike para los modelos AR, y luego discuten sobre AIC, AICc y BIC. Recorren las derivaciones bastante a fondo.
Lo que tienen en común es que investigan lo que sucede cuando usas algunos datos observados en la muestra. {Xt} para estimar los parámetros del modelo y luego observar alguna función de pérdida (error de predicción cuadrático medio o divergencia de KL) en algunos datos no observados / hipotéticos fuera de la muestra {Yt}que surge del uso del modelo estimado en estos nuevos datos. Las ideas principales son que a) tome la expectativa con respecto a todos los datos, y 2) use algunos resultados asintóticos para obtener expresiones para algunas de las expectativas. La cantidad de (1) le brinda el rendimiento general esperado, pero (2) supone que tiene muchos más datos de los que realmente tiene. No soy un experto, pero supongo que los enfoques de validación cruzada también apuntan a estas medidas de rendimiento; pero en lugar de considerar los datos hipotéticos fuera de la muestra, utilizan datos reales que se separaron de los datos de entrenamiento.
El ejemplo más simple es el criterio FPE. Suponga que estima su modelo AR en todos los datos (algo así como el conjunto de prueba) y obtenga{ϕ^yo}yo. Entonces la pérdida esperada en los datos no observados{Yt} (es hipotético, no se divide como en la validación cruzada) es
mi(Yn + 1-ϕ^1Ynorte- ⋯ -ϕ^pagsYn + 1 - p)2= E(Yn + 1-ϕ1Ynorte- ⋯ -ϕpagsYn + 1 - p-(ϕ^1-ϕ1)Ynorte- ⋯ - (ϕ^pags-ϕpags)Yn + 1 - p)2= E(Zt+ (ϕ^1-ϕ1)Ynorte- ⋯ - (ϕ^pags-ϕpags)Yn + 1 - p)2=σ2+ E[ E[ ( (ϕ^1-ϕ1)Ynorte- ⋯ - (ϕ^pags-ϕpags)Yn + 1 - p)2El | {Xt} ] ]=σ2+ E[∑i = 1pags∑j = 1pags(ϕ^yo-ϕyo) (ϕ^j-ϕj) E[Yn + 1 - iYn + 1 - jEl | {Xt} ] ]=σ2+ E[ (ϕ^pags-ϕpags)′Γpags(ϕ^pags-ϕpags) ]≈σ2( 1 +pagsnorte)≈norteσ^2n - p( 1 +pagsnorte) =σ^2n + pn - p.(error tipográfico en el libro: norte- 1 / 2 debiera ser norte1 / 2)( nσ^2/ /σ2 aprox. χ2n - p)
No conozco ningún artículo fuera de mi cabeza que compare empíricamente el rendimiento de estos criterios con las técnicas de validación cruzada. Sin embargo, este libro ofrece muchos recursos sobre cómo FPE, AIC, AICc y BIC se comparan entre sí.