¿Cuándo usar el modelo de mezcla gaussiana?

9

Soy nuevo en el uso de GMM. No pude encontrar ninguna ayuda apropiada en línea. ¿Podría alguien proporcionarme el recurso adecuado sobre "Cómo decidir si usar GMM se ajusta a mi problema?" o en caso de problemas de clasificación "¿Cómo decidir si tengo que usar la clasificación SVM o la clasificación GMM?"

Vinay
fuente
¿Cuál es su conjunto de datos y cuál es su problema exacto? Se utiliza cuando los datos siguen (es una mezcla de) más de 1 distribución normal. Ver otra pregunta: stats.stackexchange.com/questions/236295/…
Arpit Sisodia
Puede pensarlo como una forma de agrupamiento donde no tiene datos etiquetados y cree que las agrupaciones latentes son perfectamente multivariadas normales.
gung - Restablece a Monica
@ arpit-sisodia, estamos trabajando en la viabilidad de una configuración de teclado de hardware que parece tener características específicas y estamos planeando modelarla usando GMM. No conocemos claramente el proceso subyacente y, por lo tanto, estamos tratando de modelar utilizando métodos de aprendizaje automático. Por lo tanto, no estamos seguros de si realmente hay una mezcla de gaussianos en el proceso subyacente. Además, es multidimensional y no podemos visualizarlo para ver si es una mezcla de gaussianos
Vinay
@ arpit-sisodia, el enlace que ha proporcionado sugiere más métodos de prueba y error para ver si GMM se ajusta a mis datos. ¿Existe una forma concluyente / regla de pulgar para decidir sobre los modelos que se utilizarán? El método de prueba y error de jugar con más mezclas puede adaptarse a mis datos. Pero, ¿hay alguna forma de decidir? Como si tuviéramos que tener la separabilidad lineal de datos para la clasificación SVM
Vinay

Respuestas:

4

En mi opinión, puede realizar GMM cuando sabe que los puntos de datos son mezclas de una distribución gaussiana. Básicamente formando grupos con diferente media y desviación estándar. Hay un buen diagrama en el sitio web scikit-learn. L

Clasificación GMM

Un enfoque es encontrar los grupos utilizando métodos de agrupación suave y luego ver si son gaussianos. Si lo están, puede aplicar un modelo GMM que representa el conjunto de datos completo.

Asesino
fuente
1
a menudo no sabemos si los puntos de datos son mezcla de gaussianos. Entonces, esto es más un juego con Gaussian y MoG y ver si encaja. Pero no hay instrucciones / reglas para seguir usando GMM correctamente
Vinay
2
Según mi experiencia, necesita encontrar el patrón en los datos que es un modelo de mezcla. Un buen artículo para leer sería este: stat.cmu.edu/~cshalizi/uADA/12/lectures/ch20.pdf
Slayer
0

Los GMM suelen ser un buen lugar para comenzar si su objetivo es (1) agrupar observaciones, (2) especificar un modelo generativo o (3) estimar densidades. De hecho, para la agrupación, los GMM son un superconjunto de k-means.

1_e
fuente