¿Cuáles son los beneficios de dar ciertos valores iniciales a las probabilidades de transición en un modelo oculto de Markov? Finalmente, el sistema los aprenderá, entonces, ¿cuál es el punto de dar valores distintos de los aleatorios? ¿El algoritmo subyacente hace una diferencia como Baum-Welch?
Si conozco las probabilidades de transición al principio con mucha precisión, y mi propósito principal es predecir las probabilidades de salida del estado oculto a las observaciones, ¿qué me aconsejarías?