Trabajo en una gran cantidad de modelos estadísticos, como Hidden Markov Models y Gaussian Mixture Models. Veo que entrenar buenos modelos en cada uno de estos casos requiere una gran cantidad de datos (> 20000 oraciones para HMM) que se toman de entornos similares como el uso final. Mi pregunta...