Elegir entre previos beta no informativos

16

Estoy buscando antecedentes no informativos para que la distribución beta funcione con un proceso binomial (Hit / Miss). Al principio pensé en usar que genera un PDF uniforme, o Jeffrey antes α = 0.5 , β = 0.5 . Pero en realidad estoy buscando antecedentes que tengan el mínimo efecto en los resultados posteriores, y luego pensé en usar un previo incorrecto de α = 0 , β = 0 α = 0.0001 , β = 0.0001 , solo para asegurar que el α y el posteriorα=1,β=1α=0.5,β=0.5α=0,β=0 . El problema aquí es que mi distribución posterior solo funciona si tengo al menos un hit y un miss. Para superar esto, pensé en usar una constante muy pequeña, comoα=0.0001,β=0.0001αserán > 0 .β>0

¿Alguien sabe si este enfoque es aceptable? Veo efectos numéricos de cambiar estos anteriores, pero ¿alguien podría darme una especie de interpretación de poner pequeñas constantes como esta como anteriores?

Mateus
fuente
1
Para muestras grandes con muchos aciertos y errores, hace poca diferencia. Para muestras pequeñas, especialmente si no hay al menos un hit y un miss, hace una gran diferencia; Incluso el tamaño de su "constante muy pequeña" puede tener un impacto sustancial. Yo sugeriría que el experimento clave para el pensamiento que podría ser qué tipo de posterior tiene sentido después de un tamaño de muestra de : esto podría persuadir a que algo como el Jeffrey s anterior es razonable1
Henry
Y hay un artículo de Kerman que sugiere 1/3 y 1/3, b
Björn
¿Qué quiere decir con "efecto mínimo en los resultados posteriores"? ¿Comparado con que?
Será
Mejoré el formato y el título de su pregunta, no dude en revertir o cambiar las ediciones.
Tim

Respuestas:

32

En primer lugar, no existe una información previa poco informativa . A continuación puede ver las distribuciones posteriores resultantes de cinco anteriores "no informativos" diferentes (descritos a continuación en la gráfica) dados datos diferentes. Como puede ver claramente, la elección de antecedentes "no informativos" afectó la distribución posterior, especialmente en los casos en que los datos en sí mismos no proporcionaron mucha información .

Posteriores de previos no informativos

α=βα1,β1α=β=1α=β=1/2α=β=1/3α=β=0α=β=εε>0

αβyn

θyB(α+y,β+ny)

α,βα=β=1n

A primera vista, Haldane antes, parece ser el más "poco informativo", ya que conduce a la media posterior, que es exactamente igual a la estimación de máxima verosimilitud

α+yα+y+β+ny=y/n

y=0y=n

Hay una serie de argumentos a favor y en contra de cada uno de los anteriores "no informativos" (ver Kerman, 2011; Tuyl et al, 2008). Por ejemplo, según lo discutido por Tuyl et al,

101

Por otro lado, el uso de anteriores uniformes para pequeños conjuntos de datos puede ser muy influyente (piénselo en términos de pseudocuentas). Puede encontrar mucha más información y discusión sobre este tema en varios documentos y manuales.

Lo siento mucho, pero no hay anteriores "mejores", "menos informativos" o "de talla única". Cada uno de ellos aporta información al modelo.

Kerman, J. (2011). Neutral no informativo e informativo conjugado beta y gamma distribuciones anteriores.Electronic Journal of Statistics, 5, 1450-1470.

Tuyl, F., Gerlach, R. y Mengersen, K. (2008). Una comparación de Bayes-Laplace, Jeffreys y otros priors. El estadístico estadounidense, 62 (1): 40-44.

Tim
fuente