Soy relativamente nuevo en las estadísticas bayesianas y he estado usando JAGS recientemente para construir modelos bayesianos jerárquicos en diferentes conjuntos de datos. Si bien estoy muy satisfecho con los resultados (en comparación con los modelos glm estándar), necesito explicar a los no estadísticos cuál es la diferencia con los modelos estadísticos estándar. Especialmente, me gustaría ilustrar por qué y cuándo los HBM funcionan mejor que los modelos más simples.
Una analogía sería útil, especialmente una que ilustra algunos elementos clave:
- los múltiples niveles de heterogeneidad
- La necesidad de más cálculos para adaptarse al modelo
- la capacidad de extraer más "señal" de los mismos datos
Tenga en cuenta que la respuesta realmente debería ser una analogía esclarecedora para las personas que no son estadísticas, no un ejemplo fácil y agradable de seguir.
bayesian
hierarchical-bayesian
nassimhddd
fuente
fuente
Respuestas:
Me gustaría ilustrar un ejemplo en cuanto a modelos relacionados con la tasa de cáncer (como en Johnson y Albert 1999). Tocará el primer y tercer elemento de su interés.Ni xi θi
Ni θi
θi θi xi∼Bin(Ni,θi) θi∼Beta(a,b) p(D,θ,η|N)=p(η)∏Ni=1Bin(xi|Ni,θi)Beta(θi|η) η=(a,b) η de los datos Si se fija a una constante, la información no fluirá entre 's y serán condicionalmente independientes. Pero al tratar a como incógnitas, permitimos a las ciudades con menos datos tomar prestada la fuerza estadística de las ciudades con más datos.
La idea principal es hacer más bayesianos y establecer prioridades sobre las anteriores para modelar la incertidumbre en los hiperparámetros. Esto permite el flujo de influencia entre 's en este ejemplo.θi η
θi
Entonces, el problema es predecir las tasas de cáncer en varias ciudades. Digamos que tenemos datos del número de personas en varias ciudades y el número de personas que murieron con cáncer . Digamos que queremos estimar las tasas de cáncer . Hay varias formas de modelarlos y a medida que vemos problemas con cada uno de ellos. Veremos cómo el modelado bayes heirachical puede superar algún problema. 1. Una forma es hacer una estimación por separado, pero sufriremos problemas de escasez de datos y subestimaríamos las tasas en cuanto a bajo .
2. Un enfoque más para gestionar el problema de la escasez de datos sería utilizar el mismo para todas las ciudades y vincular los parámetros, pero esto también es una suposición muy sólida. 3. Entonces, lo que se podría hacer es que todos los son similares de alguna manera pero también con variaciones específicas de la ciudad. Entonces, uno podría modelar de tal manera que todos los se extraigan de una distribución común. Digamos y Una distribución conjunta completa sería entonces donde . Necesitamos inferir
η = ( a , b ) η θ i η θ i
fuente
Cuando está enfermo, observa síntomas, pero lo que desea es un diagnóstico. Si no es médico, supongo que simplemente puede encontrar el diagnóstico que mejor se adapte a sus síntomas. Pero lo que haría Ph HBM es observar sus síntomas, su importancia relativa, cómo encajan / relacionan sus diferentes problemas de salud anteriores, el de su familia, las enfermedades comunes actuales y las condiciones ambientales, su debilidad, su fortaleza ... y luego combinará estas cosas usando su conocimiento para actualizar lo que adivina de sus condiciones de salud y le dará el diagnóstico más probable.
Estoy seguro de que esta analogía alcanza su límite muy pronto, pero creo que puede dar una buena intuición de lo que uno esperaría de un HBM, ¿verdad? (y no encontré uno mejor)
fuente