Pregunta : ¿La configuración a continuación es una implementación sensata de un modelo de Markov oculto?
Tengo un conjunto de datos de 108,000
observaciones (tomadas en el transcurso de 100 días) y aproximadamente 2000
eventos a lo largo de todo el período de observación. Los datos se parecen a la figura a continuación, donde la variable observada puede tomar 3 valores discretos y las columnas rojas resaltan los tiempos de evento, es decir, :t E
Como se muestra con rectángulos rojos en la figura, he diseccionado { a } para cada evento, tratándolos efectivamente como "ventanas previas al evento".t E - 5
Entrenamiento de HMM: planeo entrenar un Modelo de Markov Oculto (HMM) basado en todas las "ventanas previas al evento", utilizando la metodología de secuencias de observación múltiple como se sugiere en la Pg. 273 del artículo de Rabiner . Con suerte, esto me permitirá entrenar un HMM que capture los patrones de secuencia que conducen a un evento.
Predicción de HMM: luego planeo usar este HMM para predecir el en un nuevo día, donde las serán un vector de ventana deslizante, actualizado en tiempo real para contener las observaciones entre el tiempo actual y medida que avanza el día.O b s e r v a t i o n s t t - 5
Espero ver un aumento en el para las que se parecen a las "ventanas previas al evento". En efecto, esto debería permitirme predecir los eventos antes de que sucedan.O b s e r v a t i o n s
Respuestas:
Un problema con el enfoque que ha descrito es que necesitará definir qué tipo de aumento de es significativo, lo que puede ser difícil ya que P ( O ) siempre será muy pequeño en general. Puede ser mejor entrenar dos HMM, digamos HMM1 para secuencias de observación donde ocurre el evento de interés y HMM2 para secuencias de observación donde el evento no ocurre. Luego, dada una secuencia de observación O , tienes P ( H H M 1 | O )PAG( O ) PAG( O ) O
y lo mismo para HMM2. Entonces puede predecir que el evento ocurrirá si
P ( H M M 1 | O )
Descargo de responsabilidad : lo que sigue se basa en mi propia experiencia personal, así que tómalo como lo que es. Una de las cosas buenas de los HMM es que le permiten lidiar con secuencias de longitud variable y efectos de orden variable (gracias a los estados ocultos). A veces esto es necesario (como en muchas aplicaciones de PNL). Sin embargo, parece que a priori asumió que solo las últimas 5 observaciones son relevantes para predecir el evento de interés. Si esta suposición es realista, entonces puede tener mucha más suerte usando técnicas tradicionales (regresión logística, ingenuo bayes, SVM, etc.) y simplemente usando las últimas 5 observaciones como características / variables independientes. Por lo general, estos tipos de modelos serán más fáciles de entrenar y (en mi experiencia) producirán mejores resultados.
fuente