Tenemos dos modelos que usan el mismo método para calcular la probabilidad de registro y el AIC para uno es más bajo que el otro. Sin embargo, el que tiene el AIC más bajo es mucho más difícil de interpretar.
Tenemos problemas para decidir si vale la pena introducir la dificultad y juzgamos esto usando una diferencia porcentual en AIC. Descubrimos que la diferencia entre los dos AIC era solo del 0,7%, y el modelo más complicado tenía un AIC un 0,7% más bajo.
¿Es la baja diferencia porcentual entre los dos una buena razón para evitar usar el modelo con el AIC más bajo?
¿El porcentaje de diferencia explica que se pierde un 0,7% más de información en el modelo menos complicado?
¿Pueden los dos modelos tener resultados muy diferentes?
model-selection
aic
Ali Turab Lotia
fuente
fuente
Respuestas:
Uno no compara los valores absolutos de dos AIC (que pueden ser como pero también ), pero considera su diferencia : donde es el AIC de -th model, y es el AIC más bajo que se obtiene entre el conjunto de modelos examinados (es decir, el modelo preferido). La regla general, descrita, por ejemplo, en Burnham y Anderson 2004 , es:∼100 ∼1000000
Ahora, con respecto al 0.7% mencionado en la pregunta, considere dos situaciones:
Por lo tanto, decir que la diferencia entre AIC es 0.7% no proporciona ninguna información.
La formulación de AIC penaliza el uso de un número excesivo de parámetros, por lo tanto, desalienta el sobreajuste. Prefiere modelos con menos parámetros, siempre que los otros no proporcionen un ajuste sustancialmente mejor. AIC intenta seleccionar un modelo (entre los examinados) que describa más adecuadamente la realidad (en la forma de los datos bajo examen). Esto significa que, de hecho, el modelo como una descripción real de los datos nunca se considera. Tenga en cuenta que AIC le proporciona la información sobre qué modelo describe mejor los datos, no ofrece ninguna interpretación .
Finalmente, con respecto a la fórmula para AIC:
TL; DR
fuente