¿Cuál es una buena analogía para ilustrar las fortalezas de los modelos bayesianos jerárquicos?

10

Soy relativamente nuevo en las estadísticas bayesianas y he estado usando JAGS recientemente para construir modelos bayesianos jerárquicos en diferentes conjuntos de datos. Si bien estoy muy satisfecho con los resultados (en comparación con los modelos glm estándar), necesito explicar a los no estadísticos cuál es la diferencia con los modelos estadísticos estándar. Especialmente, me gustaría ilustrar por qué y cuándo los HBM funcionan mejor que los modelos más simples.

Una analogía sería útil, especialmente una que ilustra algunos elementos clave:

  • los múltiples niveles de heterogeneidad
  • La necesidad de más cálculos para adaptarse al modelo
  • la capacidad de extraer más "señal" de los mismos datos

Tenga en cuenta que la respuesta realmente debería ser una analogía esclarecedora para las personas que no son estadísticas, no un ejemplo fácil y agradable de seguir.

nassimhddd
fuente
44
El clásico problema de las "ocho escuelas" parece ser un gran candidato para introducir HBM. andrewgelman.com/2014/01/21/…
Sycorax dice Reinstate Monica
2
@ cafe876. No veo cómo la naturaleza bayesiana del modelado es específica para su punto. ¿Su pregunta es realmente específica del modelo jerárquico bayesiano? o simplemente al modelo jerárquico?
peuhp
@peuhp desde mi experiencia, el marco bayesiano hace posible la estimación de modelos mucho más complejos.
nassimhddd

Respuestas:

3

Me gustaría ilustrar un ejemplo en cuanto a modelos relacionados con la tasa de cáncer (como en Johnson y Albert 1999). Tocará el primer y tercer elemento de su interés.
Entonces, el problema es predecir las tasas de cáncer en varias ciudades. Digamos que tenemos datos del número de personas en varias ciudades y el número de personas que murieron con cáncer . Digamos que queremos estimar las tasas de cáncer . Hay varias formas de modelarlos y a medida que vemos problemas con cada uno de ellos. Veremos cómo el modelado bayes heirachical puede superar algún problema. 1. Una forma es hacer una estimación por separado, pero sufriremos problemas de escasez de datos y subestimaríamos las tasas en cuanto a bajo .Nixiθi
Ni
2. Un enfoque más para gestionar el problema de la escasez de datos sería utilizar el mismo para todas las ciudades y vincular los parámetros, pero esto también es una suposición muy sólida. 3. Entonces, lo que se podría hacer es que todos los son similares de alguna manera pero también con variaciones específicas de la ciudad. Entonces, uno podría modelar de tal manera que todos los se extraigan de una distribución común. Digamos y Una distribución conjunta completa sería entonces donde . Necesitamos inferirθi
θiθixiBin(Ni,θi)θiBeta(a,b)
η = ( a , b ) η θ i η θ ip(D,θ,η|N)=p(η)i=1NBin(xi|Ni,θi)Beta(θi|η)η=(a,b)ηde los datos Si se fija a una constante, la información no fluirá entre 's y serán condicionalmente independientes. Pero al tratar a como incógnitas, permitimos a las ciudades con menos datos tomar prestada la fuerza estadística de las ciudades con más datos. La idea principal es hacer más bayesianos y establecer prioridades sobre las anteriores para modelar la incertidumbre en los hiperparámetros. Esto permite el flujo de influencia entre 's en este ejemplo.θiη
θi

dksahuji
fuente
Gracias, este es un buen ejemplo, sin embargo, no es una analogía. Realmente estoy buscando algo que pueda explicar a un no estadístico.
nassimhddd
Supongo que el intercambio y la variación en diferentes niveles se pueden usar para no estadísticos.
dksahuji
eso es cierto, pero ¿no hay una historia más simple para ilustrar esto?
nassimhddd
3

Cuando está enfermo, observa síntomas, pero lo que desea es un diagnóstico. Si no es médico, supongo que simplemente puede encontrar el diagnóstico que mejor se adapte a sus síntomas. Pero lo que haría Ph HBM es observar sus síntomas, su importancia relativa, cómo encajan / relacionan sus diferentes problemas de salud anteriores, el de su familia, las enfermedades comunes actuales y las condiciones ambientales, su debilidad, su fortaleza ... y luego combinará estas cosas usando su conocimiento para actualizar lo que adivina de sus condiciones de salud y le dará el diagnóstico más probable.

Estoy seguro de que esta analogía alcanza su límite muy pronto, pero creo que puede dar una buena intuición de lo que uno esperaría de un HBM, ¿verdad? (y no encontré uno mejor)

peuhp
fuente
Me gusta esa analogía! Tal vez se desarrolle un poco agregando que podría agregar que algunos síntomas son más significativos para ciertas conclusiones potenciales (resultados de análisis de sangre) que otros (a veces me duele un poco la pantorrilla izquierda)
MikeP
Un buen ejemplo ... donde creo que se queda corto es que parece implicar que la fortaleza de HBM radica en el acceso a MÁS información (historia, familia, etc.); mientras quiero expresar que HBM es más sofisticado con la MISMA información. ¿Hay alguna forma de adaptar tu historia?
nassimhddd
@ cafe876. Gracias, déjame un poco de tiempo para pensarlo.
peuhp