Digamos que tengo un problema de selección de modelo y estoy tratando de usar AIC o BIC para evaluar los modelos. Esto es sencillo para los modelos que tienen algún número de parámetros con valores reales.
Sin embargo, ¿qué sucede si uno de nuestros modelos (por ejemplo, el modelo Mallows ) tiene una permutación, además de algunos parámetros con valores reales en lugar de solo parámetros con valores reales? Todavía puedo maximizar la probabilidad sobre los parámetros del modelo, por ejemplo, obteniendo una permutación y un parámetro p . Sin embargo, ¿para cuántos parámetros cuenta π para calcular AIC / BIC?
Respuestas:
Intuitivamente, sospecho que el conjunto de todas las permutaciones en los elementos es equivalente a p 2 - 2 p + 1p p2−2p+1 parámetros .
Esto se debe a que las matrices de permutación son los puntos extremos del espacio convexo de matrices reales doblemente estocásticas de rango , y en general las matrices doblemente estocásticas tienen parámetros p 2 - 2 p + 1 (obtienes 2 restricciones p porque todas las filas las sumas deben ser todas 1 y las sumas de columna deben ser todas 1, pero una de ellas es redundante, por lo que tiene 2 restricciones p - 1 en las entradas p 2 ).p p2−2p+1 2p 2p−1 p2
No tengo pruebas, pero parece correcto. ¿Quizás vale la pena intentarlo numéricamente?
fuente