Alisado de Laplace y Dirichlet previo

11

En el artículo de Wikipedia sobre el suavizado de Laplace (o suavizado aditivo), se dice que desde un punto de vista bayesiano,

esto corresponde al valor esperado de la distribución posterior, utilizando una distribución de Dirichlet simétrica con el parámetro como previo.α

Estoy desconcertado acerca de cómo eso es realmente cierto. ¿Podría alguien ayudarme a entender cómo esas dos cosas son equivalentes?

¡Gracias!

DanielX2010
fuente

Respuestas:

10

Por supuesto. Esta es esencialmente la observación de que la distribución de Dirichlet es un conjugado previo para la distribución multinomial. Esto significa que tienen la misma forma funcional. El artículo lo menciona, pero solo enfatizaré que esto se desprende del modelo de muestreo multinomial. Entonces, poniéndolo en práctica ...

xKN=i=1KxixπDir(α)K

παx

p(π|x,α)=p(x|π)p(π|α)

p(x|π)

p(x|π)=N!x1!xk!π1x1πkxk

y

p(π|α)=1B(α)i=1Kπiα1

B(α)=Γ(α)KΓ(Kα)

p(π|α,x)=p(x|π)p(π|α)i=1Kπixi+α1.

En otras palabras, el posterior también es Dirichlet. La pregunta era sobre la media posterior. Como el posterior es Dirichlet, podemos aplicar la fórmula para la media de un Dirichlet para encontrar que,

E[πi|α,x]=xi+αN+Kα.

¡Espero que esto ayude!


fuente
p(π|α,x)=p(x|π)p(π|α)/p(x|α),p(π|α,x)=p(x|π)p(π|α)?π, pero escribir una igualdad no es cierto, creo.
michal
α+nsuccessα+β+nsuccess+nfailuresα+nsuccess1α+β+nsuccess+nfailures2α=β=1
0

Como nota al margen, también me gustaría agregar otro punto a la derivación anterior, que en realidad no se trata de la pregunta principal. Sin embargo, hablando de los antecedentes de Dirichlet sobre distribución multinomial, pensé que valía la pena mencionar que cuál sería la forma de función de probabilidad si vamos a tomar las probabilidades como variables molestas.

p(π|α,x)i=1Kπixi+α1p(x|α)

p(x|α)=i=1Kp(x|πi,α)p(π|α)dπ1dπ2...dπK

p(x|α)=Γ(Kα)Γ(N+Kα)i=1KΓ(xi+α)Γ(α)

N

omidi
fuente