Según tengo entendido, la Computación Bayesiana Aproximada (ABC) y la Cadena de Markov Monte Carlo (MCMC) tienen objetivos muy similares. A continuación describo mi comprensión de estos métodos y cómo percibo las diferencias en su aplicación a los datos de la vida real.
Computación Bayesiana Aproximada
ABC consiste en muestrear un parámetro partir de una simulación numérica previa, calcular una estadística que se compara con algunos observados . Basado en un algoritmo de rechazo, se retiene o se rechaza. La lista de retenidos hizo la distribución posterior.x i x o b s x i x i
Cadena Markov Monte Carlo
MCMC consiste en muestrear una distribución previa del parámetro . Toma una primera muestra , calcula y luego salta (según alguna regla) a un nuevo valor para el cual se calcula nuevamente. La relación se calcula y, según algún valor de umbral, el próximo salto ocurrirá desde la primera o la segunda posición. La exploración de valores va uno y uno y al final, la distribución de los valores retenidos es la distribución posterior (por una razón que aún desconozco).
Me doy cuenta de que mis explicaciones no representan la variedad de métodos que existe bajo cada uno de estos términos (especialmente para MCMC).
ABC vs MCMC (pros y contras)
ABC tiene la ventaja de que no es necesario poder resolver analíticamente . Como tal, ABC es conveniente para un modelo complejo donde MCMC no lo haría.
MCMC permite realizar pruebas estadísticas (prueba de razón de verosimilitud, prueba G, ...) mientras que no creo que esto sea factible con ABC.
¿Estoy en lo cierto hasta ahora?
Pregunta
- ¿Cómo difieren ABC y MCMC en sus aplicaciones? ¿Cómo se decide hacer uso de uno u otro método?
Respuestas:
Algunos comentarios adicionales además de la respuesta de Björn:
ABC fue presentado por primera vez por Rubin (1984) como una explicación de la naturaleza de la inferencia bayesiana, más que con fines computacionales. En este artículo, explicó cómo interactúan la distribución de muestreo y la distribución previa para producir la distribución posterior.
Sin embargo, ABC se explota principalmente por razones computacionales. Los genetistas de población idearon el método en modelos basados en árboles donde la probabilidad de la muestra observada era intratable. Los esquemas de MCMC (aumento de datos) que estaban disponibles en dichos entornos eran terriblemente ineficientes y también lo era el muestreo de importancia, incluso con un parámetro de una sola dimensión ... En esencia, ABC es un sustituto de los métodos de Monte Carlo como MCMC o PMC cuando esos no están disponibles para todos los fines prácticos. Cuando están disponibles, ABC aparece como un proxy que puede usarse para calibrarlos si se ejecuta más rápido.
En una perspectiva más moderna, personalmente considero ABC como un método de inferencia aproximado en lugar de una técnica computacional. Al construir un modelo aproximado, uno puede hacer inferencia sobre el parámetro de interés sin depender necesariamente de un modelo preciso. Si bien es necesario cierto grado de validación en esta configuración, no es menos válido que promediar modelos o no paramétricos. De hecho, ABC puede verse como un tipo especial de estadísticas bayesianas no paramétricas.
También se puede demostrar que el ABC (ruidoso) es un enfoque bayesiano perfectamente bien definido si se reemplaza el modelo y los datos originales por uno ruidoso. Como tal, permite todas las inferencias bayesianas que uno pueda pensar. Incluyendo pruebas. Nuestro aporte al debate sobre ABC y las pruebas de hipótesis es que el modelo aproximado subyacente ABC puede terminar mal equipado para evaluar la relevancia de una hipótesis dada la información, pero no necesariamente , lo cual es igual de bueno ya que la mayoría de las aplicaciones de ABC en la población La genética tiene que ver con la elección del modelo.
En una perspectiva aún más reciente, podemos ver ABC como una versión bayesiana de inferencia indirecta donde los parámetros de un modelo estadístico están relacionados con los momentos de una estadística predeterminada. Si esta estadística es suficiente (o suficiente en el sentido vernáculo) para identificar estos parámetros, se puede demostrar que ABC converge al valor verdadero de los parámetros con el número de observaciones.
fuente
De hecho, existen versiones de MCMC de ABC, que abordan el problema de que si tiene un previo que no se parece mucho al posterior (por ejemplo, porque el previo es muy poco informativo), extraer del anterior es extremadamente ineficiente, porque muy rara vez obtener una coincidencia estrecha entre los datos observados y los simulados.
fuente