¿Qué es "mezcla" en un modelo de mezcla gaussiana

8

A menudo estudiamos el modelo de mezcla gaussiana como un modelo útil en el aprendizaje automático y sus aplicaciones.

¿Cuál es el significado físico de esta " mezcla "?

¿Se utiliza porque un modelo de mezcla gaussiana modela la probabilidad de una serie de variables aleatorias, cada una con su propio valor de media? Si no, ¿cuál es la interpretación correcta de esta palabra?

Upendra01
fuente

Respuestas:

11

UNA La distribución combina diferentes distribuciones de componentes con pesos que generalmente suman uno (o pueden renormalizarse). UNA es el caso especial donde los componentes son gaussianos.

Por ejemplo, aquí hay una mezcla de 25% N(2,1) y 75% N(2,1), que podrías llamar "una parte N(2,1) y tres partes N(2,1)":

xx <- seq(-5,5,by=.01)
plot(xx,0.25*dnorm(xx,-2,1)+0.75*dnorm(xx,2,1),type="l",xlab="",ylab="")

mezcla

Esencialmente, es como una receta. Juega un poco con los pesos, los medios y las variaciones para ver qué sucede, o mira las dos etiquetas en CV.

Stephan Kolassa
fuente
7

Sí, una mezcla gaussiana se llama así porque se supone que los datos observados provienen de una distribución de mezcla gaussiana que consiste en KGaussianos con sus propios medios y variaciones. sin embargo, elK las clases están latentes y también lo es el indicador que le dice a qué clase pertenece una observación.

El objetivo del modelado de mezclas ahora es estimar la clase más probable para cada observación. Por lo tanto, el modelado de mezcla gaussiana puede verse como un problema de datos faltantes. La estimación generalmente se realiza utilizando el algoritmo EM.

tomka
fuente
¿Puedo suponer que los K gaussianos están relacionados entre sí (a través de pesos tales que su suma es igual a uno)
Upendra01
@Snowbell Sí, por lo general se supone que los pesos están normalizados en el sentido de que suman 1. Para obtener información general sobre las mezclas, puede consultar en.wikipedia.org/wiki/Mixture_distribution
tomka