Considere la función de densidad posterior dada (como de costumbre) por
Bajo ciertas condiciones, la distribución posterior es asintóticamente normal (un resultado conocido como el teorema de Bernstein-von Mises, ver egvd Vaart, Asymptotic Statistics , Sección 10.2, para argumentos rigurosos, o Young & Smith, Essentials of Statistical Inference , Sección 9.12 , para una discusión informal).
¿Hay algún ejemplo (con suerte elemental) en el que la parte posterior bayesiana no sea asintóticamente normal? En particular, hay ejemplos donde
- y son continuamente diferenciables con respecto a ?
- para todos ?
Un ejemplo que noté en la literatura es que donde son variables aleatorias Cauchy independientes con parámetro de ubicación . En este caso, con probabilidad positiva existen múltiples máximos locales de la función de verosimilitud (Ver Young y Smith, Ejemplo 8.3). Quizás esto puede presentar un problema en el teorema de B-vM aunque no estoy seguro.
Actualización: Las condiciones suficientes para BvM son (como se indica en vd Vaart, Sección 10.2):
los datos se obtienen de la distribución con parámetro fijo
el experimento es "diferenciable en media cuadrática" en con matriz de información de Fisher no singular
lo anterior es absolutamente continuo en una región alrededor
el modelo es continuo e identificable
existe una prueba que separa desde para algunos
fuente
Respuestas:
1. ¿El ejemplo de Cauchy contradice el teorema de Bernstein von-Mises?
No. El teorema de Bernstein von-Mises no es aplicable cuando la distribución conjunta no tiene un segundo momento diferenciable. Y, obviamente, las variables aleatorias conjuntas de Cauchy iid ni siquiera tienen un segundo momento finito. Esta condición requiere una suposición de energía limitada en la variedad Riemanniana definida por la métrica Rao-Fisher que no satisface Cauchys.
2. ¿Hay algún ejemplo (con suerte elemental) en el que la parte posterior bayesiana no sea asintóticamente normal? En particular, hay ejemplos dondeπ,f son continuamente diferenciables con respecto a θ ? π(θ)>0 para todos θ ?
Si. De hecho, podemos elegir un previo impropio (no informativo)π∝C0 haciendo que la parte posterior también sea inadecuada. Por ejemplof∝C1 Es un ejemplo trivial. Un posterior incorrecto no puede ser normal. Por ejemplo, [Rubio & Steel] (14) proporcionó un ejemplo en el que Jeffereys antes conducía a un posterior incorrecto que no puede ser normal sin importar cuán grande sea el tamaño de la muestra.
Referencia
[Rubio & Steel] Rubio, Francisco J. y Mark FJ Steel. "Inferencia en modelos de escala de ubicación de dos piezas con antecedentes de Jeffreys". Análisis Bayesiano 9.1 (2014): 1-22.
fuente