¿Existe un método estándar para tratar el problema de cambio de etiqueta en la estimación MCMC de modelos de mezcla?

15

El cambio de etiqueta (es decir, la distribución posterior es invariante al cambio de etiquetas de componentes) es un problema problemático cuando se usa MCMC para estimar modelos de mezcla.

  1. ¿Existe una metodología estándar (como la ampliamente aceptada) para tratar el problema?

  2. Si no existe un enfoque estándar, ¿cuáles son los pros y los contras de los enfoques principales para resolver el problema de cambio de etiqueta?

whuber
fuente
Estaba considerando preguntar "¿Cómo puedo hacer un modelo MCMC de la salida en lmer para modelos con pendientes aleatorias?" pero me pregunto si esa pregunta es redundante con esta. Es decir, ¿es el "problema de cambio de etiqueta" cuando se usa MCMC para estimar modelos de mezcla que el mismo tipo de problema hace que pvals.fnc () en languageR pueda interceptar modelos MCMC pero no modelos con pendientes? Si no es así, hágamelo saber y volveré a hacer mi pregunta inicial.
russellpierce
@drknexus No sé R para comentar en su pregunta. Tal vez, solo debería publicar su pregunta con un comentario de que su qn puede estar alineada con esta.

Respuestas:

14

Aquí hay una discusión agradable y razonablemente reciente sobre este problema:

Christian P. Robert Multimodalidad y cambio de etiqueta: una discusión. Taller sobre mezclas, ICMS 3 de marzo de 2010.

Esencialmente, hay varias estrategias estándar, y cada una tiene ventajas y desventajas. Lo más obvio es formular el prior de tal manera que se garantice que solo hay un modo posterior (por ejemplo, ordenar los medios de los componentes de la mezcla), pero esto resulta tener un efecto extraño en el posterior, y por lo tanto, no se usa generalmente. Lo siguiente es ignorar el problema durante el muestreo y luego procesar el resultado para volver a etiquetar los componentes y mantener las etiquetas consistentes. Esto es fácil de implementar y parece funcionar bien. Los enfoques más sofisticados vuelven a etiquetar en línea, ya sea manteniendo un solo modo o permutando deliberadamente al azar las etiquetas para garantizar la mezcla en múltiples modos. Me gusta bastante el último enfoque, pero esto todavía deja el problema de cómo resumir la salida de manera significativa. Sin embargo, veo eso como un problema separado.

Darren Wilkinson
fuente
1
parece que el enlace está roto
Edgar Santos
Arreglé el enlace al encontrarlo en web.archive.org y al proporcionar un enlace a una copia de las diapositivas alojadas por el autor en SlideShare.
Tim
9

Gilles Celeux también trabajó en el problema del cambio de etiquetas, p. Ej.

G. Celeux, inferencia bayesiana para la mezcla: el problema de cambio de etiqueta. Actas Compstat 98 , pp. 227-232, Physica-Verlag (1998).

Como complemento a la excelente respuesta de @ darrenjw, aquí hay dos documentos en línea que revisaron estrategias alternativas:

  1. Jasra y col. métodos de Markov Chain Monte Carlo y el problema de cambio de etiqueta en el modelado de mezclas bayesianas
  2. Sperrin et al., Estrategias de rediseño probabilístico para el problema de cambio de etiqueta en modelos de mezcla bayesiana
chl
fuente