Problema
Estoy escribiendo una función R que realiza un análisis bayesiano para estimar una densidad posterior dado un previo y datos informados. Me gustaría que la función envíe una advertencia si el usuario necesita reconsiderar lo anterior.
En esta pregunta, estoy interesado en aprender a evaluar un previo. Las preguntas anteriores han cubierto la mecánica de declarar a los informados anteriores ( aquí y aquí ).
Los siguientes casos pueden requerir que se reevalúe lo anterior:
- los datos representan un caso extremo que no se tuvo en cuenta al declarar
- errores en los datos (por ejemplo, si los datos están en unidades de g cuando lo anterior está en kg)
- se eligió el prior incorrecto de un conjunto de priors disponibles debido a un error en el código
En el primer caso, los anteriores son generalmente lo suficientemente difusos como para que los datos generalmente los abrumen a menos que los valores de los datos se encuentren en un rango no compatible (por ejemplo, <0 para logN o Gamma). Los otros casos son errores o errores.
Preguntas
- ¿Hay algún problema relacionado con la validez del uso de datos para evaluar un previo?
- ¿Hay alguna prueba en particular más adecuada para este problema?
Ejemplos
Aquí hay dos conjuntos de datos que no coinciden con un anterior porque son de poblaciones con (rojo) o (azul).
Los datos azules podrían ser una combinación válida de datos anteriores + mientras que los datos rojos requerirían una distribución previa que sea compatible con valores negativos.
set.seed(1)
x<- seq(0.01,15,by=0.1)
plot(x, dlnorm(x), type = 'l', xlim = c(-15,15),xlab='',ylab='')
points(rnorm(50,0,5),jitter(rep(0,50),factor =0.2), cex = 0.3, col = 'red')
points(rnorm(50,8,0.5),jitter(rep(0,50),factor =0.4), cex = 0.3, col = 'blue')
fuente
Aquí mis dos centavos:
Creo que debería preocuparse por los parámetros anteriores sobre los asociados a las proporciones.
Usted habla de información previa, pero creo que debería advertir a los usuarios acerca de lo que es una información previa razonable no informativa. Quiero decir, a veces una varianza normal con media cero y 100 es bastante poco informativa y a veces es informativa, dependiendo de las escalas utilizadas. Por ejemplo, si está retrocediendo los salarios en alturas (centímetros) que el anterior anterior es bastante informativo. Sin embargo, si retrocede los salarios de registro en alturas (metros), entonces el anterior anterior no es tan informativo.
Si está utilizando un prior que es el resultado de un análisis previo, es decir, el nuevo prior es en realidad un antiguo posterior de un análisis anterior, entonces las cosas son diferentes. Supongo que este es el caso.
fuente