¿Qué distribuciones anteriores podrían / ​​deberían usarse para la varianza en un modelo bayesisan jerárquico cuando la varianza media es de interés?

16

En su artículo ampliamente citado Distribuciones previas para parámetros de varianza en modelos jerárquicos (916 citas hasta ahora en Google Scholar) Gelman propone que las distribuciones anteriores no informativas para la varianza en un modelo bayesiano jerárquico son la distribución uniforme y la distribución de media t. Si entiendo bien las cosas, esto funciona bien cuando el parámetro de ubicación (por ejemplo, la media) es de interés principal. A veces, el parámetro de varianza es de interés principal, sin embargo, por ejemplo, cuando se analizan los datos de respuesta humana de las tareas de tiempo, la variabilidad de tiempo es a menudo la medida de interés. En esos casos, no está claro para mí cómo la variabilidad podría modelarse jerárquicamente con, por ejemplo, distribuciones uniformes, ya que después del análisis quiero obtener la credibilidad de la varianza media tanto a nivel de participante como a nivel de grupo.

Mi pregunta es entonces: ¿Qué distribución se recomienda al construir un modelo bayesiano jerárquico cuando la varianza de los datos es de interés principal?

Sé que la distribución gamma puede reparametrizarse para especificarse por medio y SD. Por ejemplo, el siguiente modelo jerárquico es del libro de Kruschke Doing Bayesian Data Analysis . Pero Gelman describe algunos problemas con la distribución gamma en su artículo y agradecería las sugerencias de alternativas, preferiblemente alternativas que no son difíciles de poner a trabajar en BUGS / JAGS.

ingrese la descripción de la imagen aquí

Rasmus Bååth
fuente

Respuestas:

2

No estoy de acuerdo con la forma en que interpretas a Gelman con respecto a la elección del parámetro Gamma para la escala. La base del modelado jerárquico es relacionar los parámetros individuales con uno común a través de una estructura con parámetros desconocidos (típicamente media y varianza). En este sentido, usar una distribución gamma para la varianza individual (o lognormal para la cola más pesada) condicionada a la varianza media y su dispersión me parece válida (al menos con respecto a los argumentos de Gelman).

Las críticas de Gelman sobre la gamma para el parámetro de escala son sobre el hecho de que la gamma se usa para aproximar los Jeffreys al establecer valores extremos a su parámetro. El problema es que, dependiendo de cuán extremos sean estos valores (lo cual es bastante arbitrario), el posterior puede ser muy diferente. Esta observación invalida el uso de este previo, al menos cuando no tenemos información para establecer en el anterior. En su discusión, me parece que la gamma o gamma inversa nunca se calibra en términos de media y varianza de la información previa o de una estructura jerárquica. Por lo tanto, su recomendación se refiere a un contexto que es bastante diferente del tuyo que, si entiendo bien tu propósito,

peuhp
fuente
0

En breve, Gelman describe los problemas en el uso de distribuciones Gamma como anteriores vagos (usa la palabra no informativo ) para la varianza. Por el contrario, su problema (y el ejemplo de Kruschke) parece referirse al caso donde existe algún conocimiento sobre la varianza. Observe también que la imagen de la distribución de la varianzaτyo No es plano en absoluto.

Altroware
fuente