Por supuesto. Esta es esencialmente la observación de que la distribución de Dirichlet es un conjugado previo para la distribución multinomial. Esto significa que tienen la misma forma funcional. El artículo lo menciona, pero solo enfatizaré que esto se desprende del modelo de muestreo multinomial. Entonces, poniéndolo en práctica ...
XKnorte= ∑Ki = 1XyoXπD i r (α)K
παX
p(π|x,α)=p(x|π)p(π|α)
p(x|π)
p(x|π)=N!x1!⋯xk!πx11⋯πxkk
y
p(π|α)=1B(α)∏i=1Kπα−1i
B(α)=Γ(α)KΓ(Kα)
p(π|α,x)=p(x|π)p(π|α)∝∏i=1Kπxi+α−1i.
En otras palabras, el posterior también es Dirichlet. La pregunta era sobre la media posterior. Como el posterior es Dirichlet, podemos aplicar la fórmula para la media de un Dirichlet para encontrar que,
E[πi|α,x]=xi+αN+Kα.
¡Espero que esto ayude!
Como nota al margen, también me gustaría agregar otro punto a la derivación anterior, que en realidad no se trata de la pregunta principal. Sin embargo, hablando de los antecedentes de Dirichlet sobre distribución multinomial, pensé que valía la pena mencionar que cuál sería la forma de función de probabilidad si vamos a tomar las probabilidades como variables molestas.
fuente