Winbugs y otros MCMC sin información para distribución previa

10

¿Qué sucede cuando no tienes una idea de la distribución de parámetros? ¿Qué enfoque debemos usar?

La mayoría de las veces buscamos entender si una determinada variable tiene alguna influencia sobre la presencia / ausencia de una determinada especie, y la variable se acepta o no de acuerdo con la importancia de la variable. Esto significa que la mayoría de las veces no estamos pensando en la distribución esperada que debería tener un parámetro.

¿Es correcto suponer que todos los parámetros siguen una distribución normal, cuando todo lo que sé es que b1, b2, b3 y b4 deberían variar entre -2 y 2, y b0 puede variar entre -5 y 5?

model {
    # N observations
    for (i in 1:N) {
        species[i] ~ dbern(p[i])
        logit(p[i]) <- b0 + b1*var1[i] + b2*var2[i] + 
            b3*var3[i] + b4*var4[i]
    }
    # Priors
    b0     ~ dnorm(0,10)
    b1   ~ dnorm(0,10)
    b2 ~ dnorm(0,10)
    b3  ~ dnorm(0,10)
    b4  ~ dnorm(0,10)
}
Gago-Silva
fuente
Si no tiene un previo, no puede usar la inferencia bayesiana. Y de ahí la metodología MCMC,
Xi'an

Respuestas:

6

Los parámetros en el predictor lineal están distribuidos en t . Cuando el número de registros llega al infinito, converge a la distribución normal. Entonces sí, normalmente se considera correcto asumir una distribución normal de parámetros.

De todos modos, en las estadísticas bayesianas, no es necesario asumir la distribución de parámetros. Normalmente se especifican los llamados antecedentes no informativos . Para cada caso, se recomiendan diferentes antecedentes no informativos. En este caso, las personas a menudo usan algo como (puede modificar los valores, por supuesto):

dunif(-100000, 100000)

o

dnorm(0, 1/10^10)

Se prefiere el segundo, porque no está limitado a valores particulares. Con antecedentes no informativos, no ha corrido ningún riesgo. Por supuesto, puede limitarlos a intervalos particulares, pero tenga cuidado.

Por lo tanto, especifique un previo no informativo y la distribución de parámetros saldrá por sí misma. No es necesario hacer suposiciones al respecto.

Curioso
fuente
1
Desafortunadamente, esto no es exactamente cierto: los límites en el uniforme anterior pueden influir en el resultado, especialmente. al probar hipótesis. Este es un inconveniente de Winbugs en mi opinión.
Xi'an
@ Xi'an, por supuesto, eso es lo que digo. Es por eso que prefiero el "plano normal" en este caso, es decir, la segunda opción. Posiblemente con ajustar el segundo parámetro.
Curioso
1
Hmmm, este no es un plano previo en absoluto ...
Xi'an
Eres libre de usar dnorm(0, 1/10^10)o lo que sea
Curioso
8

Desafortunadamente, los antecedentes inofensivos pueden ser muy peligrosos (e incluso han engañado a algunos bayesianos experimentados).

Este artículo reciente proporciona una buena introducción junto con métodos de trazado para visualizar el anterior y el posterior (generalmente anteriores / posteriores marginales para los parámetros de interés).

Peligros ocultos de especificar prioridades no informativas. John W. Seaman III, John W. Seaman Jr. y James D. Stamey The American Statistician Volumen 66, Número 2, mayo de 2012, páginas 77-84. http://amstat.tandfonline.com/doi/full/10.1080/00031305.2012.695938

Tales argumentos, en mi opinión, deberían ser obligatorios en cualquier análisis bayesiano real, incluso si el analista no los necesita; lo que está sucediendo en un análisis bayesiano debería quedar claro para la mayoría de los lectores.

Phaneron
fuente
2
buen enlace, es una pena que no esté disponible gratuitamente.
Curioso
6

El análisis de sensibilidad suele ser un buen camino a seguir: pruebe diferentes antecedentes y vea cómo cambian sus resultados con ellos. Si son robustos, probablemente pueda convencer a muchas personas sobre sus resultados. De lo contrario, es probable que desee cuantificar de alguna manera cómo cambian los resultados los resultados anteriores.

Locura
fuente