Modelado jerárquico bayesiano de las tasas de incidencia

8

El libro de Kevin Murphy discute un problema bayesiano jerárquico clásico (originalmente discutido en Johnson and Albert, 1999, p24):

Supongamos que estamos tratando de estimar la tasa de cáncer en ciudades. En cada ciudad, tomamos muestras de una cantidad de individuos y medimos la cantidad de personas con cáncer , donde es la verdadera tasa de cáncer en la ciudad.NNixiBin(Ni,θi)θi

Nos gustaría estimar los 's mientras que las ciudades pobres en datos prestada la fuerza estadística de las ciudades ricas en datos.θi

Para hacerlo, modela para que todas las ciudades compartan lo mismo antes, para que los modelos finales tengan el siguiente aspecto:θiBeta(a,b)

p(D,θ,η|N)=p(η)i=1NBin(xi|Ni,θi)Beta(θi|η)

donde .η=(a,b)

La parte crucial de este modelo es, por supuesto (cito), "que inferimos de los datos, ya que si simplemente lo a una constante, será condicionalmente independiente, y allí no habrá flujo de información entre ellos ".η=(a,b)θi


Estoy tratando de modelar esto en PyMC , pero por lo que entiendo, necesito un previo para y (creo que esto es anterior). ¿Cuál sería un buen prior para este modelo?abp(η)

En caso de que ayude, el código, como lo tengo ahora es:

bins = dict()
ps   = dict()
for i in range(N_cities):
    ps[i]   = pm.Beta("p_{}".format(i), alpha=a, beta=b)
    bins[i] = pm.Binomial('bin_{}'.format(i), p=ps[i],n=N_trials[i],  value=N_yes[i], observed=True)

mcmc = pm.MCMC([bins, ps])

donde creo que necesito un previo para ay b. ¿Cómo debo elegir uno?

Amelio Vazquez-Reina
fuente

Respuestas:

9

Un problema similar se discute en Gelman, Bayesian Data Analysis , (2ª ed., P. 128; 3ª edición, p. 110). Gelman sugiere un previo, que restringe efectivamente el "tamaño de muestra anterior" , y por lo tanto, el beta hiperprior no es altamente informativo por sí mismo. (A medida que crece la cantidad , la varianza de la distribución beta se reduce; en este caso, la varianza anterior más pequeña limita el "peso" de los datos observados en la parte posterior). Además, esta anterior no establece si , o lo contrario, por lo que las distribuciones apropiadas de pares de se infieren de todos los datos juntos, como preferiría en este problema.p(a,b)(a+b)5/2a+ba+ba>b(a,b)

Gelman también sugiere volver a calibrar el modelo en términos del logit de la media de y el "tamaño de muestra" del anterior. Entonces, en lugar de hacer inferencia en directamente, el problema es acerca de la inferencia en las cantidades transformadas y . Esto admite valores anteriores transformados en el plano real, en lugar de valores anteriores no transformados que deben ser estrictamente positivos. Además, esto logra una densidad posterior que es más difusa cuando se traza. Esto hace que los gráficos que lo acompañan sean más legibles, lo que me parece útil.θ(a,b)logit(aa+b)log(a+b)

Sycorax dice reinstalar a Mónica
fuente
1
Gracias @ user777. Desafortunadamente, no puedo usar priors de múltiples variantes en este momento, así que dejé una pregunta de seguimiento aquí
Amelio Vazquez-Reina