¿Muestreo de distribución marginal usando distribución condicional?

12

Quiero muestrear a partir de una densidad univariada pero solo sé la relación:fX

fX(x)=fX|Y(x|y)fY(y)dy.

Quiero evitar el uso de MCMC (directamente en la representación integral) y, dado que y son fáciles de muestrear, estaba pensando en usar el siguiente muestreador :f Y ( y )fX|Y(x|y)fY(y)

  1. Para .j=1,,N
  2. Muestra .yjfY
  3. Muestra .xjfX|Y(|yj)

Luego, terminaré con los pares , y tomaré solo las muestras marginales . ¿Es esto correcto?( x 1 , , x N )(x1,y1),...,(xN,yN)(x1,,xN)

varilla
fuente

Respuestas:

10

Si eso es correcto. Básicamente, tienes

FX,Y(X,y)=FXEl |Y(XEl |y)FY(y),

y como dijiste, puedes tomar muestras de la densidad conjunta. Recoger solo las s de las muestras lo lleva a una muestra de la distribución marginal.X

Esto se debe a que el acto de ignorar la es similar a integrarse sobre ella. Vamos a entender esto con un ejemplo.y

Supongamos que = Altura de las madres e = Altura de la hija. El objetivo es obtener una muestra de para comprender la relación entre las alturas de las hijas y sus madres. (Estoy asumiendo que solo hay una hija en la familia, y restringiendo la población a todas las hijas mayores de 18 años para asegurar el crecimiento completo).Y ( X , Y )XY(X,Y)

Usted sale y obtiene una muestra representativa

(X1,y1),...,(Xnorte,ynorte).

Por lo tanto, para cada madre, tienes la altura de su hija. Debe haber una clara relación entre y . Ahora suponga que de su conjunto de datos, ignora todos los datos de las hijas (suelte la ), entonces, ¿qué tiene? Tienes exactamente alturas de las madres elegidas al azar que será se basa en la marginal de .Y Y N XXYYnorteX

Greenparker
fuente
Gracias por esto, esto es útil. ¿Sabe si esta estrategia de muestreo puede vincularse con el muestreo de Gibbs para justificarla formalmente?
Rod
1
Si puede muestrear fácilmente desde la distribución conjunta, ignorar la para obtener el marginal para no necesita justificación. Es una cosa común que hacer. Tal vez, pueda decir que es una variable de Linchpin , pero como no necesita el muestreo de Gibbs para muestrear desde , no hay necesidad de MCMC aquí. x y yyxyy
Greenparker
1
Greenparker, pero ¿hay una prueba formal de esa afirmación, es decir, considerar solo una parte de la muestra tomada de la articulación da una muestra del marginal?
Un viejo en el mar.
Muestrear "X = madres" mediante el muestreo (X, Y) y tomar X en realidad le da muestras de "madres que tienen exactamente una hija adulta", lo que no es lo mismo que "madres". Pero incluso si cambiamos su ejemplo para decir que está interesada en "X = madres que tienen exactamente una hija completamente adulta", llegar a X por muestreo (X, Y) sesga su muestra en función de la distribución de Y. p (v ) = ∑ (u en soporte (U)) (p (u, v))) = ∑ (u en soporte (U)) (p (v | u) * p (u))) = (1 / sampleSize ( u)) * ∑ (u en la muestra (U)) (p (v | u))), porque cada valor de u aparece en la muestra con probabilidad p (u), por lo que debe promediar p (v | u) empates
radumanolescu