Estoy considerando un espacio grande (pero finito) de modelos de complejidad variable que exploro usando RJMCMC . Lo anterior en el vector de parámetros para cada modelo es bastante informativo.
¿En qué casos (si corresponde) debería preocuparme la paradoja de Jeffreys-Lindley que favorece modelos más simples cuando uno de los modelos más complejos sería más adecuado?
¿Hay ejemplos simples que resalten los problemas de la paradoja en la elección del modelo bayesiano?
He leído un par de artículos, a saber, el blog de Xian y el blog de Andrew Gelman , pero todavía no acabo de entender el problema.
Respuestas:
Perdón por no estar claro en mi blog !
Nota: proporcioné algunos antecedentes sobre la elección del modelo bayesiano y la paradoja de Jeffreys-Lindley en esta otra respuesta en Cross validada.
La paradoja de Jeffreys-Lindley está relacionada con la elección del modelo bayesiano en que la probabilidad marginal deja de tener sentido cuando es una medida -finita (es decir, una medida con masa infinita) en lugar de una medida de probabilidad. La razón de esta dificultad es que la masa infinita hace que y indistinguibles para cualquier constante positiva . En particular, el factor Bayes no puede usarse y no debe usarse cuando un modelo está dotado de un "plano" anterior.π σ π c π
La paradoja original de Jeffreys-Lindley utiliza la distribución normal como ejemplo. Al comparar los modelos y el factor Bayes es Está bien definido cuando es un prior apropiado pero si toma un previo normal en y deje que vaya al infinito, el denominador va a cero para cualquier valor de diferente de cero y cualquier valor de . (A menos que yx ~ N ( θ , 1 ) B 12 = exp { - n ( ˉ x n ) 2 / 2 }
Ahora, si sus antecedentes son informativos (y por lo tanto correctos), no hay razón para que ocurra la paradoja de Jeffreys-Lindley. Con un número suficiente de observaciones, el factor Bayes seleccionará de manera consistente el modelo que generó los datos. (O, más precisamente, el modelo dentro de la colección de modelos considerados para la elección del modelo más cercano al modelo "verdadero" que generó los datos).
fuente