El cambio de etiqueta (es decir, la distribución posterior es invariante al cambio de etiquetas de componentes) es un problema problemático cuando se usa MCMC para estimar modelos de mezcla.
¿Existe una metodología estándar (como la ampliamente aceptada) para tratar el problema?
Si no existe un enfoque estándar, ¿cuáles son los pros y los contras de los enfoques principales para resolver el problema de cambio de etiqueta?
Respuestas:
Aquí hay una discusión agradable y razonablemente reciente sobre este problema:
Esencialmente, hay varias estrategias estándar, y cada una tiene ventajas y desventajas. Lo más obvio es formular el prior de tal manera que se garantice que solo hay un modo posterior (por ejemplo, ordenar los medios de los componentes de la mezcla), pero esto resulta tener un efecto extraño en el posterior, y por lo tanto, no se usa generalmente. Lo siguiente es ignorar el problema durante el muestreo y luego procesar el resultado para volver a etiquetar los componentes y mantener las etiquetas consistentes. Esto es fácil de implementar y parece funcionar bien. Los enfoques más sofisticados vuelven a etiquetar en línea, ya sea manteniendo un solo modo o permutando deliberadamente al azar las etiquetas para garantizar la mezcla en múltiples modos. Me gusta bastante el último enfoque, pero esto todavía deja el problema de cómo resumir la salida de manera significativa. Sin embargo, veo eso como un problema separado.
fuente
Gilles Celeux también trabajó en el problema del cambio de etiquetas, p. Ej.
Como complemento a la excelente respuesta de @ darrenjw, aquí hay dos documentos en línea que revisaron estrategias alternativas:
fuente