¿Por qué el PDF de Dirichlet Distribution no parece integrarse a 1?

He estado tratando de encontrar el valor esperado de una función de una variable aleatoria con una distribución de Dirichlet integrando su producto con la función de densidad de Dirichlet sobre un simplex en R.

Para verificar que estaba aplicando la función correcta en R, intenté integrar la función de densidad en todo el simplex, esperando obtener 1, sin embargo, seguí obteniendo esa función de densidad para una distribución de Dirichlet con n categorías integradas a sqrt (n) (usando Paquete R SimplicialCubature).

Asumí que esto debe estar mal, pero luego miré la función de densidad para 2 categorías, considere el caso donde alphas = (1,1). Entonces la función de densidad es uniformemente 1 (tomando la función de densidad de https://en.wikipedia.org/wiki/Dirichlet_distribution ). Entonces, la integral de la función de densidad sobre el 1-simplex simplemente da la longitud del 1-simplex. Pero esto es sqrt (2), como encontré con el código R.

¿Que me estoy perdiendo aqui?

probability distributions dirichlet-distribution EBartrum
fuente

Con dos variables, está definiendo un segmento de línea en $\mathbb{R}^2$ , como usted señaló. Sin embargo, debido a la restricción simplex, una de estas dos variables es redundante en términos de especificar la densidad, ya que existe una relación uno a uno entre $x_1$ y $x_2$ . Por lo tanto, la densidad se especifica sobre $K-1$ variables libres (es decir, en $\mathbb{R}$ )

Esto se señala en la primera línea de esta sección del artículo de Wikipedia, aunque de manera muy sutil.

Por lo tanto, su función de densidad se convierte en:

D i r_{1, 1} (x_{1}, 1 - x_{1}) = \frac{Γ (2)}{Γ (1)^{2}} (x_{1})^{0} (1 - x_{1})^{0} = 1

$Dir_{1,1}(x_1,1-x_1)=\frac{\Gamma(2)}{\Gamma(1)^2}(x_1)^0(1-x_1)^0=1$

Por lo tanto,

\int_{0}^{1} D i r_{1, 1} (x_{1}, 1 - x_{1}) d x_{1} = 1

$\int_0^1 Dir_{1,1}(x_1,1-x_1) dx_1 = 1$

Respuesta al comentario de OP

Debido a las restricciones simples, la densidad de Dirichlet de dos variables en realidad se degenera en $\mathbb{R}^2$ , como se muestra en mi construcción anterior (solo requiere una variable). Si bien es cierto, tiene una densidad de $1$ , no tiene una densidad de $1$ en el segmento de línea que conecta $(1,0)$ con $(0,1)$ . Lo que muestra la construcción anterior es que la densidad marginal tiene un valor de $1$ . Tu confusión viene de pensar en $x_2$ como una variable libre, en cuyo caso el soporte de Dirichlet en $\mathbb{R}^2$ tendría un área distinta de cero. Esta intuición está bien en casos como el gaussiano bivariado, donde las dos variables no están perfectamente correlacionadas, pero no en este caso.

Podemos derivar esto formalmente de la siguiente manera:

Dejar $L$ ser algún número en $[0,\sqrt{2}]$ especificando la distancia desde $(1,0)$ a $(0,1)$ a lo largo del segmento de línea de conexión. Por lo tanto, cada valor de $L$ identifica un único $(x_ 1,x_2)$ par. Usando esta notación, su suposición de que la densidad es $1$ a lo largo de esta línea se reduce a:

P (L \in [a, b] \subset) = b - a

$P(L \in [a,b] \subset)=b-a$

Sin embargo, podemos mostrar que este no es el caso a través de un tratamiento formal de la densidad articular de $x_1,x_2$ :

P_{L} (L \in [a, b]) = P_{X_{1}, X_{2}} [(x_{1}, x_{2}) \in A_{[a, b]}]

$P_L(L\in [a,b])=P_{X_1,X_2}[(x_1,x_2) \in A_{[a,b]}]$

Dónde $A_{[a,b]}:= \{(u,v): u \in [1-\frac{b}{\sqrt{2}},1-\frac{a}{\sqrt{2}}], v = 1- u]$

Ahora, calculemos $P_L(L\in [a,b])$ :

P_{L} (L \in [a, b]) = \int_{A_{[a, b]}} d P_{X_{1}, X_{2}} = \int_{A_{[a, b]}} d P_{X_{1}} d P_{X_{2} | X_{1}} = \int_{A_{[a, b]}} 1 d P_{X_{1}} = \int_{1 - \frac{b}{\sqrt{2}}}^{1 - \frac{a}{\sqrt{2}}} 1 d u =

$P_L(L\in [a,b])= \int_{A_{[a,b]}} dP_{X_1,X_2}= \int_{A_{[a,b]}} dP_{X_1}dP_{X_2|X_1} =\int_{A_{[a,b]}} 1 \;dP_{X_1} = \int_{1-\frac{b}{\sqrt{2}}}^{1-\frac{a}{\sqrt{2}}}1\; du =$

(1 - \frac{a}{\sqrt{2}}) - (1 - \frac{b}{\sqrt{2}}) = \frac{1}{\sqrt{2}} (b - a)

$\left(1-\frac{a}{\sqrt{2}}\right) - \left(1-\frac{b}{\sqrt{2}}\right) = \frac{1}{\sqrt{2}}(b-a)$

Donde se produce la tercera igualdad porque $dP_{X_2|X_1} = 1$ para $X_2=1-X_1$ (es decir, no es una densidad, sino una masa de probabilidad de punto en $1-X_1$ )

Como puede ver, hemos recuperado el $\frac{1}{\sqrt{2}}$ constante de normalización para la densidad a lo largo del segmento de línea en $\mathbb{R}^2$ . Efectivamente, esta densidad articular (degenerada) es solo una transformación lineal de uno de los dos marginales (cualquiera de los dos funcionará). Esto da como resultado el dominio de la densidad de probabilidad para pasar de $1$ a $\sqrt{2}$ , por lo tanto, la densidad debe disminuir para compensar.

fuente

Muchas gracias, estoy de acuerdo con la lógica de lo que ha escrito, pero no puedo cuadrar eso en mi mente con el hecho de que la función tiene un valor constante 1 y la línea tiene una longitud sqrt (2). Entonces, ¿por qué la integral no debería dar sqrt (2)?

EBartrum

@EBartrum Agregaré algunas aclaraciones alrededor de las 7:30 EDT

@EBartrum agregó algunos detalles más para completar la publicación (sé que ya aceptó, pero otros pueden querer los detalles adicionales)

¿Por qué el PDF de Dirichlet Distribution no parece integrarse a 1?

Respuestas: