Construcción de distribución Dirichlet con distribución Gamma.

18

Supongamos que X1,,Xk+1 son variables aleatorias mutuamente independientes, cada una con una distribución gamma con parámetros αi,i=1,2,,k+1 muestra que Yi=XiX1++Xk+1,i=1,,k, tienen una distribución conjunta comoDirichlet(α1,α2,,αk;αk+1)

PDF conjunto de Luego para encontrar la articulación pdf de No puedo encontrar jacobian, es decir,(X1,,Xk+1)=ei=1k+1xix1α11xk+1αk+11Γ(α1)Γ(α2)Γ(αk+1)(Y1,,Yk+1)J(x1,,xk+1y1,,yk+1)

Argha
fuente
3
Eche un vistazo a las páginas 13-14 de este documento .
@Procrastinator Muchas gracias, su documento es la mejor respuesta para mi pregunta.
Argha
2
@Procrastinator: ¿tal vez debería poner esto como respuesta, ya que el OP está contento con él y agregar un par de oraciones para que no se dispare la advertencia "queremos una respuesta de más de una oración"?
jbowman
44
Ese documento ahora no responde porque es un 404.
whuber
2
Wayback machine to the rescue: pdf
mobeets

Respuestas:

30

Los jacobianos, los determinantes absolutos del cambio de la función variable, parecen formidables y pueden ser complicados. Sin embargo, son una parte esencial e inevitable del cálculo de un cambio de variable multivariante. Parece que no hay nada más que escribir una matriz de derivadas por k + 1 y hacer el cálculo.k+1k+1

Hay una mejor manera Se muestra al final en la sección "Solución". Debido a que el propósito de esta publicación es presentar a los estadísticos lo que puede ser un método nuevo para muchos, gran parte está dedicado a explicar la maquinaria detrás de la solución. Este es el álgebra de las formas diferenciales . (Las formas diferenciales son las cosas que uno integra en múltiples dimensiones). Se incluye un ejemplo detallado y trabajado para ayudar a que esto se vuelva más familiar.


Antecedentes

Hace más de un siglo, los matemáticos desarrollaron la teoría del álgebra diferencial para trabajar con las "derivadas de orden superior" que ocurren en la geometría multidimensional. El determinante es un caso especial de los objetos básicos manipulados por tales álgebras, que típicamente son formas multilineales alternas . La belleza de esto radica en cuán simples pueden ser los cálculos.

Aquí está todo lo que necesitas saber.

  1. Un diferencial es una expresión de la forma " ". Es la concatenación de " d " con cualquier nombre de variable.dxire

  2. Una forma única es una combinación lineal de diferenciales, como o incluso x 2 d x 1 - exp ( x 2 ) d x 2 . Es decir, los coeficientes son funciones de las variables.dx1+dx2X2reX1-Exp(X2)reX2

  3. Las formas se pueden "multiplicar" usando un producto de cuña , escrito . Este producto es anti-conmutativo (también llamado alternativo ): para cualquiera de las dos formas únicas ω y η ,ωη

    ωη=-ηω.

    Esta multiplicación es lineal y asociativa: en otras palabras, funciona de manera familiar. Una consecuencia inmediata es que , lo que implica que el cuadrado de cualquier forma única siempre es cero. ¡Eso hace que la multiplicación sea extremadamente fácil!ωω=-ωω

  4. Para manipular los integrandos que aparecen en los cálculos de probabilidad, una expresión como puede entenderse como | d x 1d x 2d x k + 1 | .reX1reX2reXk+1El |reX1reX2reXk+1El |

  5. Cuando es una función, entonces su diferencial está dado por la diferenciación:y=g(x1,,xn)

    dy=dg(x1,,xn)=gx1(x1,,xn)dx1++gx1(x1,,xn)dxn.

La conexión con los jacobianos es esta: el jacobiano de una transformación es, hasta el signo, simplemente el coeficiente de d x(y1,,yn)=F(x1,,xn)=(f1(x1,,xn),,fn(x1,,xn)) que aparece en informáticadx1dxn

dy1dyn=df1(x1,,xn)dfn(x1,,xn)

después de expandir cada uno de los como una combinación lineal de d x j en la regla (5).dfidxj


Ejemplo

La simplicidad de esta definición de jacobiano es atractiva. ¿Aún no estás convencido de que valga la pena? Considere el conocido problema de convertir integrales bidimensionales de coordenadas cartesianas a coordenadas polares ( r , θ ) , donde ( x , y ) = ( r cos ( θ ) , r sin ( θ ) ) . La siguiente es una aplicación completamente mecánica de las reglas anteriores, donde " ( )(x,y)(r,θ)(x,y)=(rcos(θ),rsin(θ))()"se usa para abreviar expresiones que obviamente desaparecerán en virtud de la regla (3), lo que implica .drdr=dθdθ=0

dxdy=|dxdy|=|d(rcos(θ))d(rsin(θ))|=|(cos(θ)drrsin(θ)dθ)(sin(θ)dr+rcos(θ)dθ|=|()drdr+()dθdθrsin(θ)dθsin(θ)dr+cos(θ)drrcos(θ)dθ|=|0+0+rsin2(θ)drdθ+rcos2(θ)drdθ|=|r(sin2(θ)+cos2(θ))drdθ)|=r drdθ.

El punto de esto es la facilidad con la que se pueden realizar tales cálculos, sin perder el tiempo con matrices, determinantes u otros objetos multiindiciales. Simplemente multiplica las cosas, recordando que las cuñas son anti-conmutativas. Es más fácil de lo que se enseña en álgebra de secundaria.


Preliminares

Veamos este álgebra diferencial en acción. En este problema, el PDF de la distribución conjunta de es el producto de los PDF individuales (porque se supone que X i es independiente). Para manejar el cambio a las variables Y i debemos ser explícitos sobre los elementos diferenciales que se integrarán. Estos forman el término d x 1 d x 2d x k + 1(X1,X2,,Xk+1)XiYidx1dx2dxk+1. Incluir el PDF da el elemento de probabilidad

fX(x,α)dx1dxk+1(x1α11exp(x1))(xk+1αk+11exp(xk+1))dx1dxk+1=x1α11xk+1αk+11exp((x1++xk+1))dx1dxk+1.

(The normalizing constant has been ignored; it will be recovered at the end.)

Staring at the definitions of the Yi a few seconds ought to reveal the utility of introducing the new variable

Z=X1+X2++Xk+1,

giving the relationships

Xi=YiZ.

This suggests making the change of variables xiyiz in the probability element. The intention is to retain the first k variables y1,,yk along with z and then integrate out z. To do so, we have to re-express all the dxi in terms of the new variables. This is the heart of the problem. It's where the differential algebra takes place. To begin with,

dxi=d(yiz)=yidz+zdyi.

Note that since Y1+Y2++Yk+1=1, then

0=d(1)=d(y1+y2++yk+1)=dy1+dy2++dyk+1.

Consider the one-form

ω=dx1++dxk=z(dy1++dyk)+(y1++yk)dz.

It appears in the differential of the last variable:

dxk+1=zdyk+1+yk+1dz=z(dy1++dyk)+(1y1yk)dz=dzω.

The value of this lies in the observation that

dx1dxkω=0

because, when you expand this product, there is one term containing dx1dx1=0 as a factor, another containing dx2dx2=0, and so on: they all disappear. Consequently,

dx1dxkdxk+1=dx1dxkzdx1dxkω=dx1dxkz.

Whence (because all products dzdz disappear),

dx1dxk+1=(zdy1+y1dz)(zdyk+ykdz)dz=zkdy1dykdz.

The Jacobian is simply |zk|=zk, the coefficient of the differential product on the right hand side.


Solution

The transformation (x1,,xk,xk+1)(y1,,yk,z) is one-to-one: its inverse is given by xi=yiz for 1ik and xk+1=z(1y1yk). Therefore we don't have to fuss any more about the new probability element; it simply is

(zy1)α11(zyk)αk1(z(1y1yk))αk+11exp(z)|zkdy1dykdz|=(zα1++αk+11exp(z)dz)(y1α11ykαk1(1y1yk)αk+11dy1dyk).

That is manifestly a product of a Gamma(α1++αk+1) distribution (for Z) and a Dirichlet(α) distribution (for (Y1,,Yk)). In fact, since the original normalizing constant must have been a product of Γ(αi), we deduce immediately that the new normalizing constant must be divided by Γ(α1++αk+1), enabling the PDF to be written

fY(y,α)=Γ(α1++αk+1)Γ(α1)Γ(αk+1)(y1α11ykαk1(1y1yk)αk+11).
whuber
fuente