¿Qué sucede cuando no tienes una idea de la distribución de parámetros? ¿Qué enfoque debemos usar?
La mayoría de las veces buscamos entender si una determinada variable tiene alguna influencia sobre la presencia / ausencia de una determinada especie, y la variable se acepta o no de acuerdo con la importancia de la variable. Esto significa que la mayoría de las veces no estamos pensando en la distribución esperada que debería tener un parámetro.
¿Es correcto suponer que todos los parámetros siguen una distribución normal, cuando todo lo que sé es que b1, b2, b3 y b4 deberían variar entre -2 y 2, y b0 puede variar entre -5 y 5?
model {
# N observations
for (i in 1:N) {
species[i] ~ dbern(p[i])
logit(p[i]) <- b0 + b1*var1[i] + b2*var2[i] +
b3*var3[i] + b4*var4[i]
}
# Priors
b0 ~ dnorm(0,10)
b1 ~ dnorm(0,10)
b2 ~ dnorm(0,10)
b3 ~ dnorm(0,10)
b4 ~ dnorm(0,10)
}
Respuestas:
Los parámetros en el predictor lineal están distribuidos en t . Cuando el número de registros llega al infinito, converge a la distribución normal. Entonces sí, normalmente se considera correcto asumir una distribución normal de parámetros.
De todos modos, en las estadísticas bayesianas, no es necesario asumir la distribución de parámetros. Normalmente se especifican los llamados antecedentes no informativos . Para cada caso, se recomiendan diferentes antecedentes no informativos. En este caso, las personas a menudo usan algo como (puede modificar los valores, por supuesto):
o
Se prefiere el segundo, porque no está limitado a valores particulares. Con antecedentes no informativos, no ha corrido ningún riesgo. Por supuesto, puede limitarlos a intervalos particulares, pero tenga cuidado.
Por lo tanto, especifique un previo no informativo y la distribución de parámetros saldrá por sí misma. No es necesario hacer suposiciones al respecto.
fuente
dnorm(0, 1/10^10)
o lo que seaDesafortunadamente, los antecedentes inofensivos pueden ser muy peligrosos (e incluso han engañado a algunos bayesianos experimentados).
Este artículo reciente proporciona una buena introducción junto con métodos de trazado para visualizar el anterior y el posterior (generalmente anteriores / posteriores marginales para los parámetros de interés).
Peligros ocultos de especificar prioridades no informativas. John W. Seaman III, John W. Seaman Jr. y James D. Stamey The American Statistician Volumen 66, Número 2, mayo de 2012, páginas 77-84. http://amstat.tandfonline.com/doi/full/10.1080/00031305.2012.695938
Tales argumentos, en mi opinión, deberían ser obligatorios en cualquier análisis bayesiano real, incluso si el analista no los necesita; lo que está sucediendo en un análisis bayesiano debería quedar claro para la mayoría de los lectores.
fuente
El análisis de sensibilidad suele ser un buen camino a seguir: pruebe diferentes antecedentes y vea cómo cambian sus resultados con ellos. Si son robustos, probablemente pueda convencer a muchas personas sobre sus resultados. De lo contrario, es probable que desee cuantificar de alguna manera cómo cambian los resultados los resultados anteriores.
fuente