Diferentes definiciones de AIC

12

De Wikipedia hay una definición del Criterio de información de Akaike (AIC) como , donde k es el número de parámetros y log L es la probabilidad de registro del modelo.AIC=2k2logLklogL

Sin embargo, nuestros notas Econometría en un estado universidad muy respetada que . Aquí σ 2es la varianza estimada de los errores en un modelo ARMA yTes el número de observaciones en el conjunto de datos de series de tiempo.AIC=log(σ^2)+2kTσ^2T

¿Es la última definición equivalente a la primera, pero simplemente ajustada para los modelos ARMA? ¿O hay algún tipo de conflicto entre las dos definiciones?

pir
fuente
3
Para el registro: criterio singular, criterio plural. (Editado en consecuencia.)
Nick Cox

Respuestas:

15

La fórmula que cita de sus notas no es exactamente AIC.

AIC es .2logL+2k

Aquí daré un resumen de una derivación aproximada que deja en claro lo que está sucediendo.

Si tiene un modelo con errores normales independientes con varianza constante,

Lσne12σ2εi2

que puede estimarse con la máxima probabilidad como

(σ^2)n/2e12nσ^2/σ^2(σ^2)n/2e12n(σ^2)n/2

(suponiendo que la estimación de es la estimación de ML)σ2

2logL+2k=nlogσ^2+2k

TpqTn

AICTlogσ^2+2k

por lo tanto

AIC/Tlogσ^2+2k/T

T

Sin embargo, si está utilizando AIC para algún otro propósito que se base en el valor real de las diferencias en AIC (como hacer inferencia multimodelo como lo describen Burnham y Anderson), entonces es importante.

Numerosos textos econométricos parecen utilizar este formulario AIC / T. Curiosamente, algunos libros parecen hacer referencia a Hurvich y Tsai 1989 o Findley 1985 para esa forma, pero Hurvich & Tsai y Findley parecen estar discutiendo la forma original (aunque solo tengo una indicación indirecta de lo que Findley hace en este momento, así que tal vez haya algo en Findley sobre eso).

σ2

Es posible que desee ver la lista de hechos y falacias de Rob Hyndman de la AIC , en particular los puntos 3 a 7. Algunos de esos puntos pueden llevarlo a ser al menos un poco cauteloso al confiar demasiado en la aproximación por la probabilidad gaussiana, pero tal vez hay una mejor justificación de la que ofrezco aquí.

No estoy seguro de que haya una buena razón para usar esta aproximación a la probabilidad de registro en lugar del AIC real, ya que muchos paquetes de series temporales en estos días tienden a calcular (/ maximizar) la probabilidad de registro real para los modelos ARMA. Parece que hay pocas razones para no usarlo.

Glen_b -Reinstate a Monica
fuente
1
Tarde o temprano, cada discusión sobre cualquier * IC se convierte en "Este es el criterio que debe usar, excepto que a menudo da una respuesta incorrecta en tal o cual circunstancia". Simplemente siendo irónico, nada crítico con una respuesta típicamente útil. Esto es igual que en la vida real, donde alguna máxima genérica como "amar a todos" suele ser anulada temporalmente por otro consejo si alguien está tratando de golpearte o estafarte.
Nick Cox
1
n
2

Creo que esto se basa en la suposición de errores normales. En econometría, usted opera utilizando asintóticos, especialmente en las aplicaciones de series de tiempo que usan AIC. Como consecuencia, el supuesto normal debería mantenerse asintóticamente para justificar este esquema de selección de modelo (asintótico).

ln(L)=(T/2)ln(2π)(T/2)ln(σ2)(1/2σ2)(xiμ)E(X)=μVar(X)=σ2x1,...,xT

LTln(σ2)(1/σ2)(Tσ^2)σ^2=T1(xix¯)σ2(1/σ2)(Tσ^2)=(1/σ^2)(Tσ^2)

AIC=2k+Tln(σ2)+11TTAICAIC/T

Jeremias K
fuente