El punto central de AIC o cualquier otro criterio de información es que menos es mejor. Entonces, si tengo dos modelos M1: y = a0 + XA + e y M2: y = b0 + ZB + u, y si el AIC del primero (A1) es menor que el del segundo (A2), entonces M1 tiene un mejor ajuste desde el punto de vista de la teoría de la información. ¿Pero hay algún punto de referencia de corte para la diferencia A1-A2? ¿Cuánto menos es en realidad menos? En otras palabras, ¿hay alguna prueba para (A1-A2) que no sea solo mirar a los ojos?
Editar: Peter / Dmitrij ... Gracias por responder. En realidad, este es un caso en el que mi experiencia sustantiva está en conflicto con mi experiencia estadística. Esencialmente, el problema NO es elegir entre dos modelos, sino al verificar si dos variables que sé que son en gran medida equivalentes agregan cantidades equivalentes de información (en realidad, una variable en el primer modelo y un vector en el segundo. Piense en el caso de un montón de variables en comparación con un índice de ellas). Como señaló Dmitrij, la mejor apuesta parece ser la Prueba de Cox. Pero, ¿hay alguna forma de probar realmente la diferencia entre el contenido de información de los dos modelos?
fuente
Respuestas:
¿Es cuestión de curiosidad, es decir, no está satisfecho con mi respuesta aquí ? Si no...
La investigación adicional de esta pregunta complicada mostró que existe una regla general de uso común, que establece que dos modelos son indistinguibles por el criterio de si la diferencia . Lo mismo que leerás en el artículo de wikipedia sobre (ten en cuenta que se puede hacer clic en el enlace). Solo para aquellos que no hacen clic en los enlaces:| A I C 1 - A I C 2 | < 2 A I CAIC |AIC1−AIC2|<2 AIC
Buena explicación y sugerencias útiles, en mi opinión. ¡No tengas miedo de leer lo que se puede hacer clic!
En adición , nota una vez más, es menos preferible para los conjuntos de datos de gran escala. Además de se puede encontrar útil aplicar versión sesgo corregido de criterio (puede usar este código o utilizar la fórmula , donde es el número de parámetros estimados). Sin embargo, la regla general será la misma.AIC BIC AIC AICc AICc=AIC+2p(p+1)n−p−1 p
R
fuente
Burnham, K. P., and Anderson, D.R. (2002). Model Selection and Multimodel Inference: A Practical Information-Theoretic Approach, 2nd ed. Springer-Verlag. ISBN 0-387-95364-7.
y la página Wiki previa a la revisión está aquíCreo que esto puede ser un intento de obtener lo que realmente no quieres.
La selección del modelo no es una ciencia. Excepto en raras circunstancias, no hay un modelo perfecto, ni siquiera un modelo "verdadero"; rara vez hay incluso un "mejor" modelo. Las discusiones sobre AIC vs. AICc vs. BIC vs. SBC vs. lo que sea me deja un tanto desconcertado. Creo que la idea es conseguir algunos BUENOS modelos. Luego elige entre ellos en función de una combinación de experiencia sustantiva e ideas estadísticas. Si no tiene experiencia sustancial (rara vez el caso; mucho más raramente de lo que la mayoría de la gente supone), elija el AIC más bajo (o AICc o lo que sea). Pero generalmente TIENES algo de experiencia, de lo contrario, ¿por qué estás investigando estas variables particulares?
fuente