¿Por qué el PDF de Dirichlet Distribution no parece integrarse a 1?

8

He estado tratando de encontrar el valor esperado de una función de una variable aleatoria con una distribución de Dirichlet integrando su producto con la función de densidad de Dirichlet sobre un simplex en R.

Para verificar que estaba aplicando la función correcta en R, intenté integrar la función de densidad en todo el simplex, esperando obtener 1, sin embargo, seguí obteniendo esa función de densidad para una distribución de Dirichlet con n categorías integradas a sqrt (n) (usando Paquete R SimplicialCubature).

Asumí que esto debe estar mal, pero luego miré la función de densidad para 2 categorías, considere el caso donde alphas = (1,1). Entonces la función de densidad es uniformemente 1 (tomando la función de densidad de https://en.wikipedia.org/wiki/Dirichlet_distribution ). Entonces, la integral de la función de densidad sobre el 1-simplex simplemente da la longitud del 1-simplex. Pero esto es sqrt (2), como encontré con el código R.

¿Que me estoy perdiendo aqui?

EBartrum
fuente

Respuestas:

12

Con dos variables, está definiendo un segmento de línea en R2, como usted señaló. Sin embargo, debido a la restricción simplex, una de estas dos variables es redundante en términos de especificar la densidad, ya que existe una relación uno a uno entrex1 y x2. Por lo tanto, la densidad se especifica sobreK1 variables libres (es decir, en R)

Esto se señala en la primera línea de esta sección del artículo de Wikipedia, aunque de manera muy sutil.

Por lo tanto, su función de densidad se convierte en:

Dir1,1(x1,1x1)=Γ(2)Γ(1)2(x1)0(1x1)0=1

Por lo tanto,

01Dir1,1(x1,1x1)dx1=1

Respuesta al comentario de OP

Debido a las restricciones simples, la densidad de Dirichlet de dos variables en realidad se degenera enR2, como se muestra en mi construcción anterior (solo requiere una variable). Si bien es cierto, tiene una densidad de1, no tiene una densidad de 1 en el segmento de línea que conecta (1,0) con (0,1). Lo que muestra la construcción anterior es que la densidad marginal tiene un valor de1. Tu confusión viene de pensar enx2 como una variable libre, en cuyo caso el soporte de Dirichlet en R2tendría un área distinta de cero. Esta intuición está bien en casos como el gaussiano bivariado, donde las dos variables no están perfectamente correlacionadas, pero no en este caso.

Podemos derivar esto formalmente de la siguiente manera:

Dejar L ser algún número en [0,2] especificando la distancia desde (1,0) a (0,1)a lo largo del segmento de línea de conexión. Por lo tanto, cada valor deL identifica un único (x1,x2)par. Usando esta notación, su suposición de que la densidad es1 a lo largo de esta línea se reduce a:

P(L[a,b])=ba

Sin embargo, podemos mostrar que este no es el caso a través de un tratamiento formal de la densidad articular de x1,x2:

PL(L[a,b])=PX1,X2[(x1,x2)A[a,b]]

Dónde A[a,b]:={(u,v):u[1b2,1a2],v=1u]

Ahora, calculemos PL(L[a,b]):

PL(L[a,b])=A[a,b]dPX1,X2=A[a,b]dPX1dPX2|X1=A[a,b]1dPX1=1b21a21du=

(1a2)(1b2)=12(ba)

Donde se produce la tercera igualdad porque dPX2|X1=1 para X2=1X1 (es decir, no es una densidad, sino una masa de probabilidad de punto en 1X1)

Como puede ver, hemos recuperado el 12 constante de normalización para la densidad a lo largo del segmento de línea en R2. Efectivamente, esta densidad articular (degenerada) es solo una transformación lineal de uno de los dos marginales (cualquiera de los dos funcionará). Esto da como resultado el dominio de la densidad de probabilidad para pasar de1 a 2, por lo tanto, la densidad debe disminuir para compensar.


fuente
1
Muchas gracias, estoy de acuerdo con la lógica de lo que ha escrito, pero no puedo cuadrar eso en mi mente con el hecho de que la función tiene un valor constante 1 y la línea tiene una longitud sqrt (2). Entonces, ¿por qué la integral no debería dar sqrt (2)?
EBartrum
@EBartrum Agregaré algunas aclaraciones alrededor de las 7:30 EDT
3
@EBartrum agregó algunos detalles más para completar la publicación (sé que ya aceptó, pero otros pueden querer los detalles adicionales)