Necesito una explicación de una oración sobre el uso de la AIC en la construcción de modelos. Hasta ahora tengo "En pocas palabras, el AIC es una medida relativa de la cantidad de variación observada explicada por diferentes modelos y permite la corrección de la complejidad del modelo".
Cualquier consejo muy apreciado.
R
The AIC is a measure of how well a model fits a dataset, penalizing models that are so flexible that they would also fit unrelated datasets just as well.
Aquí hay una definición que ubica a AIC en la colección de técnicas utilizadas para la selección del modelo. La AIC es solo una de varias formas razonables de capturar el equilibrio entre la bondad de ajuste (que se mejora al agregar la complejidad del modelo en forma de variables explicativas adicionales, o al agregar advertencias como "pero solo el jueves, cuando llueve") y la parsimonia (más simple == mejor) al comparar modelos no anidados. Aquí está la letra pequeña:
fuente
Qué tal si:
Si eso está demasiado lejos en la dirección no técnica, hágamelo saber en los comentarios y llegaré a otro.
fuente
AIC es una medida de qué tan bien los datos son explicados por el modelo corregido por lo complejo que es el modelo.
fuente
La otra cara de la excelente respuesta de @ gung:
El AIC es un número que mide qué tan bien un modelo se ajusta a un conjunto de datos, en una escala móvil que requiere modelos más elaborados para ser significativamente más precisos con el fin de calificar mejor.EDITAR:
El AIC es un número que mide qué tan bien un modelo se ajusta a un conjunto de datos, en una escala móvil que requiere modelos que sean significativamente más elaborados o flexibles para que también sean significativamente más precisos.
fuente
Sea k el número de parámetros de un modelo y MaxL el valor de la función de probabilidad en su máximo. Entonces el Criterio de información de Akaike se define comoUn yoC= 2 k - 2 ln( Ma x L ) . El objetivo es encontrar un modelo que minimice el AIC.
Dada esta definición, el AIC es un criterio utilizado para elegir el modelo que produce el mejor compromiso entre la dispersión en el número de parámetros y la probabilidad máxima para la estimación de esos parámetros.
fuente