¿Por qué un antes de la variación se considera débil?

21

Fondo

Una de las variaciones previas débiles más comúnmente utilizadas es la gamma inversa con parámetros (Gelman 2006) .α=0.001,β=0.001

Sin embargo, esta distribución tiene un IC del 90% de aproximadamente .[3×1019,]

library(pscl)
sapply(c(0.05, 0.95), function(x) qigamma(x, 0.001, 0.001))

[1] 3.362941e+19          Inf

A partir de esto, interpreto que el da una baja probabilidad de que la varianza sea muy alta, y la muy baja probabilidad de que la varianza sea menor que 1 .P ( σ < 1 | α = 0.001 , β = 0.001 ) = 0.006IG(0.001,0.001)P(σ<1|α=0.001,β=0.001)=0.006

pigamma(1, 0.001, 0.001)
[1] 0.006312353

Pregunta

¿Me estoy perdiendo algo o es realmente un previo informativo?

Actualización para aclarar, la razón por la que estaba considerando este 'informativo' es porque afirma muy fuertemente que la varianza es enorme y está más allá de la escala de casi cualquier varianza jamás medida.

seguimiento ¿un metaanálisis de un gran número de estimaciones de varianza proporcionaría un previo más razonable?


Referencia

Gelman 2006. Distribuciones previas para parámetros de varianza en modelos jerárquicos . Análisis Bayesiano 1 (3): 515–533

David LeBauer
fuente
1
Un "verdadero" no informativo previo no es una distribución. Entonces no hay probabilidad previa como P (sigma <1).
Stéphane Laurent

Respuestas:

38

Usando la distribución gamma inversa, obtenemos:

p(σ2|α,β)(σ2)α1exp(βσ2)

Puede ver fácilmente que si y α 0 , la gamma inversa se acercará a Jeffreys antes. Esta distribución se llama "no informativa" porque es una aproximación adecuada a la anterior Jeffreysβ0α0

p(σ2)1σ2

log(σ2)σ20L>0U<

log(σ2)

LUαβσ2LUq(b)Uniform(log(L),log(U))σ(b)2=exp(q(b))

probabilidadislogica
fuente
55
+1 por no solo responder la pregunta, sino también por brindar consejos útiles.
whuber
log(σ)
Beta2(1,1)F1,1Beta2(0,0)
probabilidadislogica
1
[0,]σexp(U(log(L),log(U))σU(L,U)
David LeBauer
(0,)α=1,β=1/2
10

Está bastante cerca del piso. Su mediana es 1.9 E298, casi el número más grande que uno puede representar en aritmética flotante de doble precisión. Como señala, la probabilidad de que se asigne a cualquier intervalo que no sea realmente grande es muy pequeña. ¡Es difícil obtener menos información que eso!

whuber
fuente
Gracias por tu explicación. Me he encontrado con problemas de convergencia y me sorprendió que muchas de las variables con las que trabajo tengan medias es <1000 (es decir, si algo es> 1000 g, se mide en kg), y las variaciones son aproximadamente del mismo orden. magnitud. Por lo tanto, me estoy dando cuenta de que necesito más antecedentes que incorporen esta información, incluso si realmente no tengo un buen conocimiento previo de su valor o cómo se divide.
David LeBauer
Dependiendo del modelo, su posterior puede estar muy cerca de ser incorrecto al usar este anterior
JMS