Como parte de la reproducción de un modelo que describí parcialmente en esta pregunta sobre Stack Overflow, quiero obtener un diagrama de una distribución posterior. El modelo (espacial) describe el precio de venta de algunas propiedades como una distribución de Bernoulli dependiendo de si la propiedad es cara (1) o barata (0). En ecuaciones:
dónde es el resultado binario 1 o 0, es la probabilidad de ser barato o caro es una variable aleatoria espacial donde representa su posición Todo esto para cada porque hay 70 propiedades en el conjunto de datos. es una matriz de covarianza basada en la posición geográfica de los puntos de datos. Si tiene curiosidad sobre este modelo, el conjunto de datos se puede encontrar aquí .
La gráfica que quiero obtener es la siguiente gráfica de contorno:
La figura se describe como "Gráfico de imagen de la superficie media posterior del proceso latente , modelo espacial binario ". El libro también dice esto:
La figura 5.8 muestra el gráfico de imagen con líneas de contorno superpuestas para la superficie media posterior del latente proceso.
Sin embargo, solo hay 70 pares de puntos en el conjunto de datos. Supongo que, para producir un diagrama de contorno, necesito estimaren 70 * 70 puntos. Entonces, mi pregunta es: ¿Cómo produzco esta superficie mediana posterior? Hasta ahora tengo muestras de distribuciones posteriores para todos los parámetros involucrados (usando PyMC) y sé que puedo predeciren un nuevo punto usando la distribución predictiva posterior. Sin embargo, no sé cómo predecir valores. en un nuevo punto . Quizás estoy equivocado y la trama no se construyó por predicción sino por interpolación.
ACTUALIZACIÓN :
Primero, esta es la mediana de la distribución posterior de en cada ubicación donde hay una propiedad. Esto se basa en la traza MCMC para.
Y esta es la interpolación (con un diagrama de contorno) usando una función de base radial:
(Si está interesado en el código, hágamelo saber)
Como puede ver, hay diferencias significativas en las parcelas. Un par de preguntas:
¿Cómo puedo saber si estas diferencias se explican por el procedimiento de interpolación?
Tal vez, hay variaciones importantes en la distribución posterior de que calculé y el que se muestra en el libro. ¿Cuánta variación es aceptable entre las simulaciones MCMC? Incluso mis propios parámetros cambian un poco dependiendo del muestreo que use (Metropolis, Metropolis Adaptive).
¿Existe algún procedimiento bayesiano para predecir puntos? para generar un diagrama de contorno como lo hice usando la función de base radial?
fuente
Respuestas:
Es muy probable que el autor haya utilizado un proceso gaussiano para producir la interpolación. Creo que es cierto porque un ejercicio en el libro describe un problema muy similar a este y requiere una trama basada en un proceso gaussiano.
Lo intenté y creo que la trama resultante comparte características con la superficie media posterior de la pregunta original. Esta es la mediana de la distribución posterior dew ( s ) como arriba (es ligeramente diferente porque ejecuté otra simulación MCMC):
Y esta es la interpolación basada en un proceso gaussiano:
Como puede ver, el método de interpolación hace una gran diferencia.
fuente