Paquetes de Python para trabajar con modelos de mezcla gaussianos (GMM)

12

Parece que hay varias opciones disponibles para trabajar con Gaussian Mixture Models (GMM) en Python. A primera vista hay al menos:

... y tal vez otros. Todos parecen satisfacer las necesidades más básicas de GMM, incluida la creación y el muestreo, la estimación de parámetros, la agrupación, etc.

¿Cuál es la diferencia entre ellos y cómo se debe determinar cuál es el más adecuado para una necesidad particular?

Ref: http://www.scipy.org/Topical_Software

Un hombre
fuente
Podría intentar crear una versión realmente simple de la compresión de imágenes utilizando GMM. Dada una imagen, use un GMM para asignar a los píxeles diferentes probabilidades y luego vuelva a crear la imagen usando las probabilidades como índices para el gaussiano particular del que es más probable que haya venido un píxel en particular.
Phillip Cloud
@cpcloud - ¿Quiere decir: configurar un experimento simplificado para ejecutar en cada uno de estos paquetes, como punto de comparación? Bueno, está bien, pero no es una pequeña cantidad de esfuerzo. Espero alguna información de las personas que han usado estos paquetes.
Aman
2
Scikit-learn es una biblioteca popular de aprendizaje automático que también tiene algún soporte de GMM. No estoy seguro de que se ajuste a sus necesidades, pero tiene la ventaja de tener otros algoritmos y marcos de aprendizaje (por ejemplo, validación cruzada, composición del modelo).
Bitwise
PyPR y PyEM solo están disponibles para Python 2, y ya no parecen estar en desarrollo activo. PyMix parece la mejor opción.
Josh Milthorpe

Respuestas:

3

No sé cómo determinar en general cuál es el mejor, pero si conoce la configuración de su aplicación lo suficientemente bien, puede simular datos y probar los paquetes en esta simulación. Las métricas de éxito podrían ser el tiempo que toma la estimación y la calidad de recuperación de su verdad fundamental simulada.

Gael Varoquaux
fuente