Estoy leyendo trabajos de investigación utilizando métodos MCMC y veo que la mayoría de ellos proporcionan trazas de trazado. ¿Por qué necesitamos trazas en la cadena Monte Carlo Markov? ¿Qué indica una traza de parámetros?
fuente
Estoy leyendo trabajos de investigación utilizando métodos MCMC y veo que la mayoría de ellos proporcionan trazas de trazado. ¿Por qué necesitamos trazas en la cadena Monte Carlo Markov? ¿Qué indica una traza de parámetros?
Cree los trazados de rastreo de parámetros para asegurarse de que su distribución a priori esté bien calibrada, lo que se indica mediante los parámetros que tienen suficientes cambios de estado a medida que se ejecuta el algoritmo MCMC.
Un ejemplo extremo es que establece su varianza de distribución a priori en 0. Luego, la estimación del parámetro posterior nunca cambiará. Su algoritmo diría que tiene la mejor estimación de parámetros, pero no verificó un número suficiente de parámetros para determinar si realmente es el mejor ajuste. Si establece la varianza de distribución a priori demasiado alta, obtendrá un problema similar. Esto se debe a que es menos probable que el nuevo parámetro esté relacionado con sus datos, por lo que es probable que la probabilidad de registro calculada con su nuevo parámetro no sea mejor que la probabilidad de registro que usa el parámetro anterior. (Un ejemplo es si su parámetro "verdadero" es 0.5 y su estimación inicial es 2, pero está seleccionando de una distribución normal con una media de 2 y una varianza de 10,000, entonces es poco probable que obtenga un parámetro más cercano a 1 .
Debe seleccionar una variación a priori que permita que los estados de sus parámetros cambien lo suficiente como para no quedarse atascado en los mínimos y máximos locales en la distribución de loglikelihood, pero lo suficientemente fino como para obtener estimaciones razonables de los parámetros. La mayoría de la literatura sugiere que haga que sus parámetros cambien de estado 40-60% del tiempo.
Otra razón para las trazas de trazado es la quema. Generalmente, el período de quemado es obvio en la gráfica (por ejemplo, si el parámetro verdadero es 1.5 y su estimación inicial es 4, entonces debería ver que las estimaciones de los parámetros se mueven rápidamente de 4 a 1.5 y luego "rebotando" alrededor de 1.5). Por lo general, solo excluye las primeras n iteraciones donde n es lo suficientemente grande como para estar seguro de haber eliminado la quemadura (digamos 1000), pero si los cálculos llevan mucho tiempo o si las estimaciones de sus parámetros tardan mucho más en converger que su n permite entonces que desee omitir más o menos observaciones para tener en cuenta la quema. Puede verificar sus parcelas para ver dónde termina el período de quemado para asegurarse de que la quema no afecte sus resultados.
Tenga en cuenta que he estado hablando en el contexto de estimaciones puntuales de parámetros. Si está estimando la varianza de los parámetros, es aún más importante asegurarse de tener los cambios de estado apropiados.