Estaba pasando por algunas conferencias relacionadas con MCMC. Sin embargo, no encuentro un buen ejemplo de cómo se usa. ¿Alguien puede darme un ejemplo concreto? Todo lo que puedo ver es que corren una cadena de Markov y dicen que su distribución estacionaria es la distribución deseada.
Quiero un buen ejemplo donde la distribución deseada es difícil de probar. Entonces creamos una cadena de Markov. Quiero saber cómo seleccionar la matriz de transición para que su distribución estacionaria de la cadena de Markov sea la distribución objetivo Gracias
probability
bayesian
mcmc
markov-process
usuario34790
fuente
fuente
Respuestas:
Un buen ejemplo de una distribución que es difícil de probar es el modelo Hard-Core, consulte esta página para obtener una descripción general:
http://www.mathematik.uni-ulm.de/stochastik/lehre/ss06/markov/skript_engl/node34.html
Este modelo define una distribución sobre cuadrículas para algunos n fijos , donde en cada punto de la cuadrícula puede tener un valor de uno o cero. Para que una cuadrícula sea admisible bajo el modelo de núcleo duro, no hay dos puntos adyacentes en la cuadrícula que puedan tener un valor de 1.n×n n
La imagen a continuación muestra un ejemplo de configuración admisible para una cuadrícula de bajo el modelo de núcleo duro. En esta imagen, los puntos se muestran como puntos negros y los ceros como blancos. Tenga en cuenta que no hay dos puntos negros adyacentes.8×8
Creo que la inspiración para este modelo proviene de la física, puede pensar en cada posición en la cuadrícula como una partícula, y el valor en esa posición representa la carga eléctrica o giro.
Queremos muestrear uniformemente de la población de cuadrículas admisibles, es decir, si es el conjunto de cuadrículas admisibles, queremos muestrear e ∈ E de manera queE e∈E
donde es el número de todas las configuraciones admisibles posibles.|E|
Esto ya presenta un desafío, dado que estamos considerando cuadrículas, ¿cómo podemos determinar | E | la cantidad de cuadrículas admisibles?n×n |E|
Una de las cosas buenas de MCMC es que le permite tomar muestras de distribuciones donde la constante de normalización es difícil o imposible de evaluar.
Le dejaré leer el documento sobre los detalles de cómo implementar MCMC para este problema, pero es relativamente sencillo.
fuente
Creo que el mejor ejemplo que puedo darte es este:
Un ejemplo de Markov Chain Monte Carlo de Murali Haran
Que incluye un código útil en R.
Creo que podría reproducir el artículo aquí, pero no tiene sentido.
fuente
Otro tema desalentador en las estadísticas. La pregunta es antigua, pero los ejemplos introductorios en línea son difíciles de encontrar. Así que permítanme simplificar dos excelentes ejemplos en caso de que alguien que sigue el recorrido aleatorio de Markov de las tierras de PageRank aquí esté aturdido por MCMC y esté lleno de anticipación para una respuesta fácil de seguir. ¿Qué tan probable? Esa podría ser una pregunta de seguimiento.
La dificultad está en darse cuenta de que después de seguir todos los pasos mecánicos, solo hay un truco mágico: la decisión binaria de aceptar o rechazar un valor propuesto .
mean
sd
rnorm(10000)
eps
runif(1, - eps, eps)
Por lo tanto, cada valor propuesto diferiría del valor anterior de manera aleatoria y dentro de los límites de
[- eps,+ eps]
.min(1, dnorm(candidate_value)/dnorm(x))
min(1, ...)
dnorm
min(1, dnorm(candidate_value)/dnorm(x))
runif(1)
x[i+1]
x[i]
sd
x = 0; vec[1] = x
Esto es más emocionante y hace referencia a la estimación de los parámetros de una curva de regresión lineal al calcular las probabilidades de registro para parámetros aleatorios dados un conjunto de datos . Sin embargo, la exégesis de las líneas de código se construye en la simulación condensada guardada aquí , siguiendo pasos muy similares al primer ejemplo.
fuente
Este video de Youtube es una visualización realmente agradable de un problema simple que se resuelve usando MCMC.
La distribución de interés es la distribución posterior sobre posibles pendientes e intersecciones en una regresión lineal (panel superior derecho). Algunas combinaciones de pendientes e intersecciones son muy probables (es decir, tienen una alta probabilidad de producir los puntos de datos observados y son consistentes con nuestras expectativas a priori ), por lo que deben tomarse muestras con frecuencia. Otras combinaciones son improbables (p. Ej., Si corresponden a una línea azul que no atraviesa la nube de puntos de datos), y deberían muestrearse con menos frecuencia.
El panel grande en la esquina inferior izquierda muestra el camino tomado por la cadena de Markov a través de un espacio bidimensional de pendientes e intersecciones. Los histogramas muestran resúmenes unidimensionales del progreso de la cadena hasta el momento. Una vez que la cadena ha funcionado lo suficiente, tenemos muy buenas estimaciones de las distribuciones para los posibles valores de la pendiente y la intersección.
En este caso, MCMC es excesivo, pero hay algunos problemas en los que es difícil escribir una solución y tiene mucho sentido explorar las posibilidades con una cadena de Markov en lugar de tratar de resolverla directamente.
fuente