¿Por qué necesitamos trazar el trazado para los resultados de MCMC

12

Estoy leyendo trabajos de investigación utilizando métodos MCMC y veo que la mayoría de ellos proporcionan trazas de trazado. ¿Por qué necesitamos trazas en la cadena Monte Carlo Markov? ¿Qué indica una traza de parámetros?

Benzamin
fuente

Respuestas:

17

Cree los trazados de rastreo de parámetros para asegurarse de que su distribución a priori esté bien calibrada, lo que se indica mediante los parámetros que tienen suficientes cambios de estado a medida que se ejecuta el algoritmo MCMC.

Un ejemplo extremo es que establece su varianza de distribución a priori en 0. Luego, la estimación del parámetro posterior nunca cambiará. Su algoritmo diría que tiene la mejor estimación de parámetros, pero no verificó un número suficiente de parámetros para determinar si realmente es el mejor ajuste. Si establece la varianza de distribución a priori demasiado alta, obtendrá un problema similar. Esto se debe a que es menos probable que el nuevo parámetro esté relacionado con sus datos, por lo que es probable que la probabilidad de registro calculada con su nuevo parámetro no sea mejor que la probabilidad de registro que usa el parámetro anterior. (Un ejemplo es si su parámetro "verdadero" es 0.5 y su estimación inicial es 2, pero está seleccionando de una distribución normal con una media de 2 y una varianza de 10,000, entonces es poco probable que obtenga un parámetro más cercano a 1 .

Debe seleccionar una variación a priori que permita que los estados de sus parámetros cambien lo suficiente como para no quedarse atascado en los mínimos y máximos locales en la distribución de loglikelihood, pero lo suficientemente fino como para obtener estimaciones razonables de los parámetros. La mayoría de la literatura sugiere que haga que sus parámetros cambien de estado 40-60% del tiempo.

Otra razón para las trazas de trazado es la quema. Generalmente, el período de quemado es obvio en la gráfica (por ejemplo, si el parámetro verdadero es 1.5 y su estimación inicial es 4, entonces debería ver que las estimaciones de los parámetros se mueven rápidamente de 4 a 1.5 y luego "rebotando" alrededor de 1.5). Por lo general, solo excluye las primeras n iteraciones donde n es lo suficientemente grande como para estar seguro de haber eliminado la quemadura (digamos 1000), pero si los cálculos llevan mucho tiempo o si las estimaciones de sus parámetros tardan mucho más en converger que su n permite entonces que desee omitir más o menos observaciones para tener en cuenta la quema. Puede verificar sus parcelas para ver dónde termina el período de quemado para asegurarse de que la quema no afecte sus resultados.

Tenga en cuenta que he estado hablando en el contexto de estimaciones puntuales de parámetros. Si está estimando la varianza de los parámetros, es aún más importante asegurarse de tener los cambios de estado apropiados.

Eric
fuente
55
+1 Pero el otro lado es que no confiamos totalmente en los diagnósticos formales de convergencia y queremos analizar algo antes de afirmar que es convergente. Si esto es completamente racional es otra cuestión ...
conjugateprior
1
Lamento desenterrar esta vieja publicación. Pero, ¿no se supone que el valor anterior (generado a partir de la distribución anterior) es irrelevante siempre que haya un número suficiente de iteraciones?
mscnvrsy
@mscnvrsy: puede poner prioridad no informativa como la anterior de Jeffry o la anterior uniforme si desea proporcionar menos información a su anterior.
Benzamin
3
Estoy completamente en desacuerdo con la idea de que las trazas de trazas MCMC están relacionadas de alguna manera con la calibración de una distribución previa. Un algoritmo MCMC apunta a una distribución posterior dada, irrelevante de la elección de la anterior, y en condiciones adecuadas crea una cadena de Markov que converge a esta distribución estacionaria. Mirar las trazas de trazos solo es útil para evaluar la convergencia o falta de ella en la cadena de Markov.
Xi'an