¿Cómo comparar modelos sobre la base de AIC?

13

Tenemos dos modelos que usan el mismo método para calcular la probabilidad de registro y el AIC para uno es más bajo que el otro. Sin embargo, el que tiene el AIC más bajo es mucho más difícil de interpretar.

Tenemos problemas para decidir si vale la pena introducir la dificultad y juzgamos esto usando una diferencia porcentual en AIC. Descubrimos que la diferencia entre los dos AIC era solo del 0,7%, y el modelo más complicado tenía un AIC un 0,7% más bajo.

  1. ¿Es la baja diferencia porcentual entre los dos una buena razón para evitar usar el modelo con el AIC más bajo?

  2. ¿El porcentaje de diferencia explica que se pierde un 0,7% más de información en el modelo menos complicado?

  3. ¿Pueden los dos modelos tener resultados muy diferentes?

Ali Turab Lotia
fuente
2
@ArunJose, no parece ser un duplicado. Las preguntas aquí son bastante diferentes.
Richard Hardy
1
No. Esta pregunta no se trata de la comparabilidad de los modelos. Ya sabemos que los modelos son comparables. Esta pregunta se refiere a lo que cuenta como una diferencia significativa en AIC y el compromiso entre la complejidad y el ajuste del modelo.
Ali Turab Lotia

Respuestas:

25

Uno no compara los valores absolutos de dos AIC (que pueden ser como pero también ), pero considera su diferencia : donde es el AIC de -th model, y es el AIC más bajo que se obtiene entre el conjunto de modelos examinados (es decir, el modelo preferido). La regla general, descrita, por ejemplo, en Burnham y Anderson 2004 , es:1001000000

Δi=AICiAICmin,
AICiiAICmin
  1. si , entonces hay un apoyo sustancial para el -ésimo modelo (o la evidencia en su contra solo vale una mención), y la proposición de que es una descripción adecuada es altamente probable;Δi<2i
  2. si , entonces hay un fuerte apoyo para el modelo ;2<Δi<4i
  3. si , entonces hay considerablemente menos soporte para el -ésimo modelo;4<Δi<7i
  4. los modelos con tienen esencialmente soporte.Δi>10

Ahora, con respecto al 0.7% mencionado en la pregunta, considere dos situaciones:

  1. AIC1=AICmin=100AIC2AIC2=100.7Δ2=0.7<2
  2. AIC1=AICmin=100000AIC2AIC2=100700Δ2=70010

Por lo tanto, decir que la diferencia entre AIC es 0.7% no proporciona ninguna información.

LΔiΔi=AICiAICminAICmin:=0

La formulación de AIC penaliza el uso de un número excesivo de parámetros, por lo tanto, desalienta el sobreajuste. Prefiere modelos con menos parámetros, siempre que los otros no proporcionen un ajuste sustancialmente mejor. AIC intenta seleccionar un modelo (entre los examinados) que describa más adecuadamente la realidad (en la forma de los datos bajo examen). Esto significa que, de hecho, el modelo como una descripción real de los datos nunca se considera. Tenga en cuenta que AIC le proporciona la información sobre qué modelo describe mejor los datos, no ofrece ninguna interpretación .

ΔiΔi<2Δi<5

i

pi=exp(Δi2),

AICminiΔi=1.5pi=0.47Δi=15pi=0.0005iAICmin

Finalmente, con respecto a la fórmula para AIC:

AIC=2k2L,

LΔi2kΔi2Δk<1

TL; DR

  1. Es una mala razón; use la diferencia entre los valores absolutos de los AIC.
  2. El porcentaje no dice nada.
  3. No es posible responder a esta pregunta debido a que no hay información sobre los modelos, los datos y qué significan los diferentes resultados .
corey979
fuente
1
Esta es la explicación más clara que he visto de este misterioso asunto. Busqué el artículo al que hizo referencia (págs. 270-272) y su explicación aquí es una representación simple y clara pero muy precisa de lo que explica el artículo.
Tripartio
¿Podrías ayudarme con esta pregunta de seguimiento? stats.stackexchange.com/questions/349883/…
Tripartio