Estoy leyendo sobre la inferencia bayesiana y me encontré con la frase "la integración numérica de la probabilidad marginal es demasiado costosa"
No tengo experiencia en matemáticas y me preguntaba qué significa exactamente caro aquí. ¿Es solo en términos de potencia de cálculo o hay algo más?
bayesian
numerical-integration
variational-bayes
approximate-inference
discretetimeisnice
fuente
fuente
Respuestas:
En el contexto de los problemas computacionales, incluidos los métodos numéricos para la inferencia bayesiana, la frase "demasiado caro" generalmente podría referirse a dos cuestiones
Para cualquier caso, los recursos computacionales que comprenden el "presupuesto" pueden consistir en cosas como ciclos de CPU ( complejidad de tiempo ), memoria ( complejidad de espacio ) o ancho de banda de comunicación ( dentro o entre nodos de cómputo). En la segunda instancia, "demasiado caro" significaría intratable .
En el contexto del cálculo bayesiano, la cita probablemente se refiere a problemas de marginación en una gran cantidad de variables .
Por ejemplo, comienza el resumen de este artículo reciente
y continúa diciendo
(A modo de comparación, este reciente capítulo de libro discute métodos considerados "no demasiado caros").
fuente
Le daré un ejemplo de caso discreto para mostrar por qué la integración / suma es tan costosa.
En la literatura de modelos gráficos probabilísticos , tal forma de calcular la distribución marginal se llama enfoque de "fuerza bruta" para realizar "inferencia". Por nombre, podemos saber que es costoso. Y las personas usan muchas otras formas de realizar la inferencia, por ejemplo, obtener la distribución marginal de manera efectiva. "Otras formas" incluyendo inferencia aproximada , etc.
fuente
Por lo general, cuando se realiza la inferencia bayesiana, es fácil encontrar una gran integración sobre variables molestas, por ejemplo. Otro ejemplo puede ser un muestreo numérico como en este caso a partir de una función de probabilidad, lo que significa realizar un muestreo aleatorio de una distribución dada. A medida que aumenta el número de parámetros del modelo, este muestreo se vuelve extremadamente pesado y se han desarrollado varios métodos computacionales para acelerar el procedimiento y permitir implementaciones muy rápidas, manteniendo, por supuesto, un alto nivel de precisión. Estas técnicas son, por ejemplo, MC, MCMC, Metropolis ecc. Eche un vistazo al análisis de datos bayesianos de Gelman et. ¡Debería darle una amplia introducción! buena suerte
fuente