¿Cuándo falla la normalidad asintótica de la parte posterior bayesiana (Bernstein-von Mises)?

10

Considere la función de densidad posterior dada (como de costumbre) por

π(θ)i=1nf(xi;θ),
con densidad previa π y distribución f(;θ) del n observaciones x1,,xn, condicional en el valor del parámetro θ.

Bajo ciertas condiciones, la distribución posterior es asintóticamente normal (un resultado conocido como el teorema de Bernstein-von Mises, ver egvd Vaart, Asymptotic Statistics , Sección 10.2, para argumentos rigurosos, o Young & Smith, Essentials of Statistical Inference , Sección 9.12 , para una discusión informal).

¿Hay algún ejemplo (con suerte elemental) en el que la parte posterior bayesiana no sea asintóticamente normal? En particular, hay ejemplos donde

  1. π y f son continuamente diferenciables con respecto a θ?
  2. π(θ)>0 para todos θ?

Un ejemplo que noté en la literatura es que donde X1,,Xn son variables aleatorias Cauchy independientes con parámetro de ubicación θ. En este caso, con probabilidad positiva existen múltiples máximos locales de la función de verosimilitud (Ver Young y Smith, Ejemplo 8.3). Quizás esto puede presentar un problema en el teorema de B-vM aunque no estoy seguro.

Actualización: Las condiciones suficientes para BvM son (como se indica en vd Vaart, Sección 10.2):

  • los datos se obtienen de la distribución con parámetro fijo θ0

  • el experimento es "diferenciable en media cuadrática" en θ0 con matriz de información de Fisher no singular I(θ0)

  • lo anterior es absolutamente continuo en una región alrededor θ0

  • el modelo es continuo e identificable

  • existe una prueba que separa H0:θ=θ0 desde H1:θθ0ε para algunos ε>0

Joris Bierkens
fuente
¿Creo que es más relevante si el soporte KL de prior contiene el parámetro TRUE?
Henry.L

Respuestas:

4

1. ¿El ejemplo de Cauchy contradice el teorema de Bernstein von-Mises?

No. El teorema de Bernstein von-Mises no es aplicable cuando la distribución conjunta no tiene un segundo momento diferenciable. Y, obviamente, las variables aleatorias conjuntas de Cauchy iid ni siquiera tienen un segundo momento finito. Esta condición requiere una suposición de energía limitada en la variedad Riemanniana definida por la métrica Rao-Fisher que no satisface Cauchys.

2. ¿Hay algún ejemplo (con suerte elemental) en el que la parte posterior bayesiana no sea asintóticamente normal? En particular, hay ejemplos donde π,f son continuamente diferenciables con respecto a θ? π(θ)>0 para todos θ?

Si. De hecho, podemos elegir un previo impropio (no informativo)πC0haciendo que la parte posterior también sea inadecuada. Por ejemplofC1Es un ejemplo trivial. Un posterior incorrecto no puede ser normal. Por ejemplo, [Rubio & Steel] (14) proporcionó un ejemplo en el que Jeffereys antes conducía a un posterior incorrecto que no puede ser normal sin importar cuán grande sea el tamaño de la muestra.

Referencia

[Rubio & Steel] Rubio, Francisco J. y Mark FJ Steel. "Inferencia en modelos de escala de ubicación de dos piezas con antecedentes de Jeffreys". Análisis Bayesiano 9.1 (2014): 1-22.

Henry.L
fuente
Gracias Henry.L, esto es muy útil, buscaré la referencia. ¡Me alegra que la pregunta finalmente haya recibido atención!
Joris Bierkens
¿Puedes dar un ejemplo simple con un previo adecuado?
Cagdas Ozgenc