Quiero calcular el AICc de un modelo de regresión de cresta. El problema es el número de parámetros. Para la regresión lineal, la mayoría de las personas sugiere que el número de parámetros es igual al número de coeficientes estimados más sigma (la varianza del error).
Cuando se trata de regresión de crestas, leí que el rastro de la matriz del sombrero, el grado de libertad (df), simplemente se usa como el término de número de parámetros en la fórmula AIC (por ejemplo, aquí o aquí ).
¿Es esto correcto? ¿Puedo simplemente usar el df para calcular el AICc? ¿Puedo simplemente agregar +1 al df para tener en cuenta la variación de error?
Respuestas:
AIC y la regresión de cresta pueden hacerse compatibles cuando se hacen ciertas suposiciones. Sin embargo, no existe un método único para elegir una contracción para la regresión de crestas, por lo tanto, no existe un método general para aplicar AIC. La regresión de cresta es un subconjunto de la regularización de Tikhonov . Hay muchos criterios que se pueden aplicar para seleccionar los factores de suavizado para la regularización de Tikhonov, por ejemplo, vea esto . Para usar AIC en ese contexto, hay un documento que hace suposiciones bastante específicas sobre cómo realizar esa regularización, selección de parámetros de regularización basada en la complejidad de la información para la solución de problemas inversos mal condicionados . En concreto, esto supone
"En un marco estadístico, ... eligiendo el valor del parámetro de regularización α , y utilizando el método de máxima probabilidad penalizada (MPL) ... Si consideramos el ruido gaussiano no correlacionado con varianza y usamos la penalización una norma complicada, vea el enlace de arriba , la solución MPL es la misma que la solución regularizada de Tikhonov (1963) ".σ2 p ( x ) =
La pregunta entonces es, ¿deberían hacerse esas suposiciones? La cuestión de los grados de libertad necesarios es secundaria a la cuestión de si AIC y la regresión de cresta se utilizan o no en un contexto coherente. Sugeriría leer el enlace para más detalles. No estoy evitando la pregunta, es solo que uno puede usar muchas cosas como objetivos de cresta, por ejemplo, uno podría usar el factor de suavizado que optimiza el AIC . Entonces, una buena pregunta merece otra, "¿Por qué molestarse con AIC en un contexto de cresta?" En algunos contextos de regresión de crestas, es difícil ver cómo AIC podría hacerse relevante. Por ejemplo, se aplicó la regresión de cresta para minimizar la propagación de error relativo de , es decir, minsi [ DE ( b )si] de la distribución gamma (GD) dada por
fuente