Densidad hiperprior para el modelo jerárquico Gamma-Poisson

En un modelo jerárquico de datos donde parece ser típico en la práctica elegir valores ( modo que la media y la varianza de la distribución gamma coincidan aproximadamente con la media y la varianza de los datos (por ejemplo, Clayton y Kaldor, 1987 "Estimaciones empíricas de Bayes de riesgos relativos estandarizados por edad para el mapeo de enfermedades", Biometría ). Claramente, esta es solo una solución ad hoc , ya que exageraría la confianza del investigador en los parámetros $y$

y \sim Poisson (λ)

$y \sim \textrm{Poisson}(\lambda)$

λ \sim Gamma (α, β)

$\lambda \sim \textrm{Gamma}(\alpha, \beta)$

α, β)

$\alpha, \beta)$

y

$y$

(α, β)

$(\alpha, \beta)$ y pequeñas fluctuaciones en los datos realizados podrían tener grandes consecuencias para la densidad gamma, incluso si el proceso de generación de datos subyacente sigue siendo el mismo.

Además, en Bayesian Data Analysis (2nd Ed), Gelman escribe que este método es " descuidado "; en el libro y en este documento (a partir de la p. 3232), sugiere que se elija cierta densidad hiperprior $p(\alpha, \beta)$ , de manera similar al ejemplo de los tumores de ratas (a partir de la p. 130).

Aunque está claro que cualquier $p(\alpha, \beta)$ es admisible siempre que produzca una densidad posterior finita, no he encontrado ningún ejemplo de densidades hiperprior que los investigadores hayan usado para este problema en el pasado. Le agradecería mucho que alguien pudiera señalarme libros o artículos que hayan empleado una densidad hiperprior para estimar un modelo de Poisson-Gamma. Idealmente, estoy interesado en $p(\alpha, \beta)$ que es relativamente plano y estaría dominado por los datos como en el ejemplo de tumor de rata, o una discusión que compara varias especificaciones alternativas y las compensaciones asociadas con cada una.

poisson-distribution gamma-distribution hierarchical-bayesian hyperparameter Sycorax dice reinstalar a Mónica
fuente

Realmente no respondo la pregunta, ya que no lo estoy señalando a libros o artículos que han empleado un hiperprior, sino que estoy describiendo y vinculando cosas sobre anteriores sobre parámetros Gamma.

Primero, tenga en cuenta que el modelo de Poisson-Gamma conduce, cuando está integrado, a una distribución binomial negativa con parámetros y . El segundo parámetro está en el rango . Si desea no ser informativo, un Jeffreys anterior en podría ser apropiado. Puede poner el prior directamente en o trabajar a través del cambio de variables para obtener: $\lambda$ $\alpha$ $\beta/(1+\beta)$ $(0,1)$ $p = \beta/(1+\beta)$ $p$

$p(\beta) \propto \beta^{-1/2}(1+\beta)^{-1}$

Alternativamente, podría observar que es el parámetro de escala para la distribución Gamma y, genéricamente, el Jeffreys anterior para un parámetro de escala es . Uno podría encontrar extraño que el Jeffreys anterior para sea diferente entre los dos modelos, pero los modelos en sí mismos no son equivalentes; uno es para la distribución de y el otro es para la distribución de . Un argumento a favor de la primera es que, suponiendo que no haya agrupación, los datos realmente se distribuyen en Binomial negativo , por lo que se colocan las prioridades directamente en y $\beta$ $\beta$ $1/\beta$ $\beta$ $y | \alpha, \beta$ $\lambda | \alpha, \beta$ $(\alpha, p)$ $\alpha$ $p$ es lo que hay que hacer. OTOH, si, por ejemplo, tiene grupos en los datos donde las observaciones en cada grupo tienen el mismo , realmente necesita modelar los s de alguna manera, y tratar así a como el parámetro de escala de una distribución Gamma Parece más apropiado. (Mis pensamientos sobre un tema posiblemente contencioso). $\lambda$ $\lambda$ $\beta$

El primer parámetro también se puede abordar a través de Jeffreys anteriores. Si utilizamos la técnica común de desarrollar los previos de Jeffreys para cada parámetro de forma independiente, luego formando el conjunto anterior (no Jeffreys) como el producto de los dos anteriores de un solo parámetro, obtenemos un previo para el parámetro de forma de una distribución Gamma : $\alpha$

$p(\alpha) \propto \sqrt{\text{PG}(1,\alpha)}$

donde la función polygamma . Torpe, pero truncable. Puede combinar esto con cualquiera de los anteriores Jeffreys anteriores para obtener una distribución previa conjunta no informativa. Combinarlo con el anterior para el parámetro de escala Gamma da como resultado una referencia previa para los parámetros Gamma. $\text{PG}(1,\alpha) = \sum_{i=0}^{\infty}(i+\alpha)^{-2}$ $1/\beta$

Si deseamos seguir la ruta completa de Jeffreys, formando los verdaderos Jeffreys antes de los parámetros Gamma, obtendríamos:

$p(\alpha, \beta) \propto \sqrt{\alpha \text{PG}(1,\alpha)-1}/\beta$

Sin embargo, los antecedentes de Jeffreys para parámetros multidimensionales a menudo tienen propiedades pobres y características de convergencia pobres (ver enlace a la conferencia ). No sé si este es el caso de Gamma, pero las pruebas proporcionarían información útil.

Para obtener más información sobre los antecedentes de Gamma, consulte la página 13-14 de Un catálogo de prioridades no informativas , Yang y Berger. También hay muchas otras distribuciones allí. Para obtener una descripción general de Jeffreys y referencias anteriores, aquí hay algunas notas de clase .

jbowman
fuente

Gracias por la respuesta muy detallada. Me llevará un par de horas leer completamente los materiales de apoyo y, en general, digerir el contenido de la publicación. Por favor, no confunda mi ritmo lento con falta de gratitud.

Sycorax dice Reinstate Monica

Densidad hiperprior para el modelo jerárquico Gamma-Poisson

Respuestas: