Criterios para seleccionar el "mejor" modelo en un modelo oculto de Markov

12

Tengo un conjunto de datos de series temporales en el que estoy tratando de ajustar un Modelo de Markov Oculto (HMM) para estimar el número de estados latentes en los datos. Mi pseudo código para hacer esto es el siguiente:

for( i in 2 : max_number_of_states ){ 
    ...
    calculate HMM with i states
    ...
    optimal_number_of_states = "model with smallest BIC"
    ...
}

Ahora, en los modelos de regresión habituales, el BIC tiende a favorecer a los modelos más parsimoniosos, pero en el caso del HMM no estoy seguro de que eso sea lo que está haciendo. ¿Alguien sabe realmente a qué tipo de HMM tiende el criterio BIC? También puedo obtener el AIC y el valor de probabilidad también. Dado que estoy tratando de inferir el verdadero número total de estados, ¿es uno de estos criterios "mejor" que el otro para este propósito?

whuber
fuente

Respuestas:

11

Supongo aquí que su variable de salida es categórica, aunque ese puede no ser el caso. Normalmente, sin embargo, cuando he visto usar HMM, el número de estados se conoce de antemano en lugar de seleccionarse mediante el ajuste. Por lo general, corresponden a alguna variable bien entendida que resulta no ser observada. Pero eso no significa que no puedas experimentar con él.

Sin embargo, el peligro de usar BIC (y AIC) es que el valor k para el número de parámetros libres en el modelo aumenta cuadráticamente con el número de estados porque tiene la matriz de probabilidad de transición con parámetros Px (P-1) (para estados P ) y las probabilidades de salida para cada categoría de la salida dado cada estado. Entonces, si el AIC y el BIC se calculan correctamente, el k debería aumentar rápidamente.

Si tiene suficientes datos, recomendaría un método más suave para ajustar el número de estados, como probar en una muestra reservada. Es posible que también desee ver la estadística de probabilidad y ver visualmente en qué punto se estabiliza. Además, si sus datos son grandes, tenga en cuenta que esto empujará el BIC a un modelo más pequeño.

Mike Nute
fuente