Explicación de una oración de la AIC para tipos no técnicos

8

Necesito una explicación de una oración sobre el uso de la AIC en la construcción de modelos. Hasta ahora tengo "En pocas palabras, el AIC es una medida relativa de la cantidad de variación observada explicada por diferentes modelos y permite la corrección de la complejidad del modelo".

Cualquier consejo muy apreciado.

R

aic rosser
fuente

11

AIC es un número que es útil para comparar modelos, ya que incluye medidas de qué tan bien el modelo se ajusta a los datos y qué tan complejo es el modelo.

Peter Flom
fuente

8

Cuál sería la mejor explicación depende de qué se entiende exactamente por "tipos no técnicos". Me gustan las declaraciones que se han ofrecido hasta ahora, pero tengo una objeción: tienden a usar el término "complejo", y lo que precisamente se entiende que puede significar podría variar. Permítanme ofrecerles esta variación:

El AIC es una medida de qué tan bien un modelo se ajusta a un conjunto de datos, mientras se ajusta a la capacidad de ese modelo para adaptarse a cualquier conjunto de datos, esté o no relacionado.

gung - Restablece a Monica
fuente

+1. Creo que esta es la clave: ¿cuándo es más flexible demasiado flexible? ¿Quizás "ajustar para" podría reformularse como "penalizar"? Entonces es algo como

The AIC is a measure of how well a model fits a dataset, penalizing models that are so flexible that they would also fit unrelated datasets just as well.

Wayne

Estoy de acuerdo en que depende de lo que se entienda por "tipos no técnicos". La mayoría de las personas con las que trabajo son doctorados en ciencias sociales, médicas o conductuales; son educados, pero no conocen estadísticas. Pero no estoy seguro de que me gusten las últimas palabras en su definición, ya que no está claro qué significa "relacionado" aquí. Tal vez en mi definición, podría sustituir "número de variables independientes" por "complejo". Creo que mucha gente sabe lo que es un IV ... ¡Pregunta interesante!

Peter Flom

@PeterFlom, tienes razón: estamos intercambiando una posible confusión por otra. En persona, cuando sabes con quién estás hablando, dudo que alguno de nosotros tenga algún problema. El requisito de 1 oración también es bastante estricto; dame un par de cifras y 5 minutos y puedo conseguir a cualquiera a bordo. Y para ser claros, no fue una crítica, me gustó su respuesta y la voté.

gung - Restablece a Monica

5

Aquí hay una definición que ubica a AIC en la colección de técnicas utilizadas para la selección del modelo. La AIC es solo una de varias formas razonables de capturar el equilibrio entre la bondad de ajuste (que se mejora al agregar la complejidad del modelo en forma de variables explicativas adicionales, o al agregar advertencias como "pero solo el jueves, cuando llueve") y la parsimonia (más simple == mejor) al comparar modelos no anidados. Aquí está la letra pequeña:

Creo que la definición del OP solo se aplica a los modelos lineales. Para cosas como probits, los AIC generalmente se definen en términos de probabilidad logarítmica.
Algunos otros criterios se ajustan (que tiene el menor ajuste para variables explicativas adicionales), Kullback-Leibler IC, BIC / SC e incluso otros más exóticos, como el criterio de predicción de Amemiya, rara vez visto en la naturaleza del trabajo aplicado . Estos criterios difieren en cuán abruptamente penalizan la complejidad del modelo. Algunos han argumentado que la AIC tiende a seleccionar modelos que están sobreparamizados, porque la penalización del tamaño del modelo es bastante baja. El BIC / SC también aumenta la penalización a medida que aumenta el tamaño de la muestra, lo que parece una característica práctica y elegante. $R^{2}$
Una buena manera de eludir la participación en el Criterio de información superior de Estados Unidos es admitir que estos criterios son arbitrarios y que se derivan aproximaciones considerables para derivarlos, especialmente en el caso no lineal. En la práctica, la elección de un modelo de un conjunto de modelos probablemente dependerá del uso previsto de ese modelo. Si el propósito es explicar las características principales de un problema complejo, la parsimonia debería valer su peso en oro. Si la predicción es el nombre del juego, la parsimonia debería ser menos querida. Algunos incluso agregarían que el conocimiento de la teoría / dominio también debería desempeñar un papel más importante. En cualquier caso, lo que planea hacer con el modelo debería determinar qué criterio podría usar.
Para modelos anidados , la prueba de hipótesis estándar que restringe los parámetros a cero debería ser suficiente.

Dimitriy V. Masterov
fuente

3

Qué tal si:

AIC le ayuda a encontrar el modelo que mejor se ajuste y que use la menor cantidad de variables.

Si eso está demasiado lejos en la dirección no técnica, hágamelo saber en los comentarios y llegaré a otro.

sparc_spread
fuente

2

¿AIC implementa la navaja de afeitar de Occam?

Dilip Sarwate

@Dilip: hasta ahora ya no puedes ver la línea, jajaja, gracias. Creo que usaré algo entre Peter y el mío.

rosser

3

AIC es una medida de qué tan bien los datos son explicados por el modelo corregido por lo complejo que es el modelo.

Juan
fuente

2

La otra cara de la excelente respuesta de @ gung:

El AIC es un número que mide qué tan bien un modelo se ajusta a un conjunto de datos, en una escala móvil que requiere modelos más elaborados para ser significativamente más precisos con el fin de calificar mejor.

EDITAR:

El AIC es un número que mide qué tan bien un modelo se ajusta a un conjunto de datos, en una escala móvil que requiere modelos que sean significativamente más elaborados o flexibles para que también sean significativamente más precisos.

Wayne
fuente

+1, esto es bueno, pero para ser honesto, me gusta más tu sugerencia "penalizadora". Me imagino personas que no entenderían lo que quieres decir con "elaborado".

gung - Restablece a Monica

@gung: Estoy de acuerdo en que esto no lo hace del todo, pero estaba tratando de cerrar la brecha de "modelos" a "explicaciones", donde la gente tal vez pueda imaginar que una explicación más elaborada necesitaría ser más precisa para justifica las palabras extra.

Wayne

-1

Sea k el número de parámetros de un modelo y MaxL el valor de la función de probabilidad en su máximo. Entonces el Criterio de información de Akaike se define como $AIC=2k-2\ln\left(MaxL\right)$ . El objetivo es encontrar un modelo que minimice el AIC.

Dada esta definición, el AIC es un criterio utilizado para elegir el modelo que produce el mejor compromiso entre la dispersión en el número de parámetros y la probabilidad máxima para la estimación de esos parámetros.

Jean-Victor Côté
fuente

Explicación de una oración de la AIC para tipos no técnicos

Respuestas: