¿Cuál es la diferencia entre la distribución predictiva posterior y posterior?

31

Entiendo lo que es un posterior, pero no estoy seguro de lo que significa este último.

¿Cómo son los 2 diferentes?

Kevin P. Murphy indicó en su libro de texto, Aprendizaje automático: una perspectiva probabilística , que es "un estado de creencia interna". ¿Qué significa eso realmente? Tenía la impresión de que un Prior representa su creencia interna o parcialidad, ¿dónde me equivoco?

ANUNCIO
fuente

Respuestas:

36

La simple diferencia entre los dos es que la distribución posterior depende del parámetro desconocido θ , es decir, la distribución posterior es:

pags(θEl |X)=do×pags(XEl |θ)pags(θ)
donde do es la constante de normalización .

Mientras que, por otro lado, la distribución predictiva posterior no depende del parámetro desconocido θ porque se ha integrado, es decir, la distribución predictiva posterior es:

pags(XEl |X)=Θdo×pags(X,θEl |X)reθ=Θdo×pags(XEl |θ)pags(θEl |X)reθ

XX

No me detendré en la explicación de la distribución posterior, ya que usted dice que la comprende, pero la distribución posterior "es la distribución de una cantidad desconocida, tratada como una variable aleatoria, condicional a la evidencia obtenida" (Wikipedia). Básicamente, es la distribución la que explica su parámetro desconocido, aleatorio.

Por otro lado, la distribución predictiva posterior tiene un significado completamente diferente en el sentido de que es la distribución de datos pronosticados en el futuro en función de los datos que ya ha visto. Entonces, la distribución predictiva posterior se usa básicamente para predecir nuevos valores de datos.

Si ayuda, es un gráfico de ejemplo de una distribución posterior y una distribución predictiva posterior:

ingrese la descripción de la imagen aquí

ingrese la descripción de la imagen aquí

Jinhua Wang
fuente
3
Ese gráfico de distribución predictiva posterior necesita nuevas etiquetas de eje y un título o algo así. Se me ocurre la idea porque sé lo que es una distribución predictiva posterior, pero alguien que se está dando cuenta podría confundirse seriamente.
Cian
Gracias @BabakP, ¿podría indicarme también qué distribución utilizó para trazar el pmf de theta y P (x * | theta)
AD
... porque me gustaría resolver el ejemplo completo.
AD
Solo pretendí que mi posterior era un Beta (3,2). En realidad no resolví nada. Pero, por supuesto, si desea un ejemplo, suponga que la probabilidad es un Binomial (n, p) y que el anterior en p es un Beta (a, b), entonces debería poder obtener que el posterior es una vez más una distribución beta .
Además, esa predicción posterior no es fácil de derivar. Acabo de tomar un gráfico de un código de proceso gaussiano que escribí para un predictivo posterior GP. Y dicho esto, ese diagrama predictivo posterior y posterior no corresponde en realidad al posterior mostrado, ambos son arbitrarios.
11

La distribución predictiva generalmente se usa cuando ha aprendido una distribución posterior para el parámetro de algún tipo de modelo predictivo. Por ejemplo, en la regresión lineal bayesiana, aprende una distribución posterior sobre el parámetro w del modelo y = wX dados algunos datos observados X.
Luego, cuando entra un nuevo punto de datos no visto x *, desea encontrar la distribución sobre posibles predicciones y * dada la distribución posterior para w que acabas de aprender. Esta distribución sobre los posibles y * dados los posteriores para w es la distribución de predicción.

usuario1893354
fuente
5

Se refieren a distribuciones de dos cosas diferentes.

La distribución posterior se refiere a la distribución del parámetro , mientras que la distribución posterior predictiva (PPD) se refiere a la distribución de futuras observaciones de datos .

SPMQET
fuente