Comparación de modelos no anidados con AIC

Digamos que tenemos que GLMMs

mod1 <- glmer(y ~ x + A + (1|g), data = dat)
mod2 <- glmer(y ~ x + B + (1|g), data = dat)

Estos modelos no están anidados en el sentido habitual de:

a <- glmer(y ~ x + A + (1|g),     data = dat)
b <- glmer(y ~ x + A + B + (1|g), data = dat)

por lo que no podemos hacer anova(mod1, mod2)lo que haría con anova(a ,b).

¿Podemos usar AIC para decir cuál es el mejor modelo?

r mixed-model aic lme4-nlme nested-models usuario1322296
fuente

Respuestas:

El AIC se puede aplicar con modelos no anidados. De hecho, este es uno de los mitos más extendidos (¿malentendidos?) Sobre AIC. Ver:

Una cosa que debe tener cuidado es incluir todas las constantes de normalización, ya que son diferentes para los diferentes modelos (no anidados):

Ver también:

En el contexto de GLMM, una pregunta más delicada es qué tan confiable es el AIC para comparar este tipo de modelos (ver también @ BenBolker's). Otras versiones de la AIC se analizan y comparan en el siguiente documento:

Sobre el comportamiento de la AIC marginal y condicional en modelos lineales mixtos

Candelabro
fuente

tenga en cuenta que la distinción de AIC marginal versus condicional es más importante cuando se trata de comparar modelos que difieren en sus conjuntos de efectos aleatorios

Ben Bolker

@ Chandelier y Ben Bolker muchas gracias por sus respuestas. ¿Alguno de ustedes tiene una referencia más formal para el argumento de usar AIC de esta manera?

user1322296

@ user1322296 Sugeriría ir a la raíz, este es el artículo de Akaike . AIC se obtiene como un estimador de la divergencia entre su modelo y el "modelo verdadero". Entonces, no se supone anidación, solo algunas condiciones de regularidad.

Araña

Entonces, ¿es válido comparar el AIC de lm1 = x ~ A + B C y lm2 = x ~ D + B C, por ejemplo? Gracias

crazjo

Parece que hay modelos no anidados para los que el uso de AIC no es apropiado. Aquí hay dos ejemplos: 1 y 2 . ¿Podría proporcionar algunas condiciones bajo las cuales funciona la selección de modelos no anidados?

Carl

Como referencia, un argumento en contra: Brian Ripley afirma en "Seleccionar entre grandes clases de modelos" págs. 6-7

Suposiciones cruciales ... Los modelos están anidados (nota al pie: vea la parte inferior de la página 615 en la reimpresión de Akaike (1973)). - AIC es ampliamente utilizado cuando no lo son

$f(x|_k\theta$

Ripley, BD 2004. "Selección entre grandes clases de modelos". En Methods and Models in Statistics , editado por N. Adams, M. Crowder, D. J Hand y D. Stephens, 155–70. Londres, Inglaterra: Imperial College Press.

Akaike, H. (1973) Teoría de la información y una extensión del principio de máxima verosimilitud. En el segundo simposio internacional sobre teoría de la información (Eds BN Petrov y F. Cáski), págs. 267–281, Budapest. Akademiai Kaidó. Reimpreso en Breakthroughs in Statistics , eds Kotz, S. & Johnson, NL (1992), volumen I, págs. 599-624. Nueva York: Springer.

Ben Bolker
fuente

Parece que Akaike pensó que AIC era una herramienta útil para comparar modelos no anidados.

"Una observación importante sobre AIC es que se define sin referencia específica al modelo verdadero [f (x | kθ)]. Por lo tanto, para cualquier número finito de modelos paramétricos, siempre podemos considerar un modelo extendido que desempeñará el papel de [f (x | kθ)] Esto sugiere que el AIC puede ser útil, al menos en principio, para la comparación de modelos que no están anidados, es decir, la situación en la que la prueba convencional de relación de probabilidad logarítmica no es aplicable ".

(Akaike 1985, pág. 399)

Akaike, Hirotugu. "Predicción y entropía". Papeles seleccionados de Hirotugu Akaike. Springer, Nueva York, NY, 1985. 387-410.

JonesBC
fuente