Supongamos que quiero muestrear a partir de una distribución continua . Si tengo una expresión de en la formap
donde y f_i son distribuciones de las que se puede muestrear fácilmente, entonces puedo generar fácilmente muestras de p de la siguiente manera:f i p
- Muestreo de una etiqueta con probabilidad
- Muestreo
¿Es posible generalizar este procedimiento si ocasionalmente es negativo? Sospecho que he visto esto en algún lugar, posiblemente en un libro, posiblemente para la distribución de Kolmogorov, por lo que estaría encantado de aceptar una referencia como respuesta.
Si un ejemplo de juguete concreto es útil, digamos que me gustaría muestra a partir de
En principio, podría ampliar esto como la siguiente suma:
Los términos dentro de la suma se pueden muestrear independientemente como variables aleatorias gamma. Evidentemente, mi problema es que los coeficientes son "ocasionalmente" negativos.
Edición 1 : aclaro que estoy buscando generar muestras exactas de , en lugar de calcular las expectativas en . Para aquellos interesados, en los comentarios se alude a algunos procedimientos para hacerlo.
Edición 2 : Encontré la referencia que incluye un enfoque particular para este problema, en 'Generación de varianza aleatoria no uniforme' de Devroye . El algoritmo es de 'Una nota sobre muestreo de combinaciones de distribuciones', de Bignami y de Matteis . El método consiste en unir efectivamente la densidad desde arriba con los términos positivos de la suma, y luego usar el muestreo de rechazo basado en este sobre. Esto corresponde al método descrito en la respuesta de @ Xi'an.
Respuestas:
Me he preguntado sobre esta pregunta pero nunca llegué con una solución satisfactoria.
Una propiedad que es de posible uso es que, si una densidad escribe donde g es una densidad tal que g ( x ) ≥ ω h ( x ) , simulando de g y rechazar estas simulaciones con probabilidad ω h ( x ) / g ( x ) proporciona simulaciones de f . En el caso actual, g es la versión normalizada de los componentes de peso positivo g ( x ) = ∑ α i > 0 α i
Un primer inconveniente de cálculo de este enfoque es que, a pesar de la simulación de primera partir de un componente elegido , las sumas en tanto g y h se debe calcular para la etapa de rechazo. Si las sumas son infinitas sin una versión de forma cerrada, esto hace que el método de aceptación-rechazo sea imposible de implementar .Fyo sol h
Una segunda dificultad es que, dado que ambas sumas de pesos son del mismo orden la tasa de rechazo 1 - ϱ aceptar = ∑ α i < 0 | α i | / ∑ i | α i | No tiene límite superior. En realidad, si la serie asociada con las α i no es absolutamente convergente, ¡la probabilidad de aceptación es cero!
En el caso de una representación mixta, si puede escribirse como f ( x ) = ∞ ∑ i = 1 α i g i ( x ) - ω i h ( x i )F el componente se puede elegir primero y luego el método aplicado al componente. Pero esto puede ser delicado de implementar, ya que identificar pares ( g i , h i ) que se ajustan a g i ( x ) - ω i h ( x i ) > 0 de la suma posiblemente infinita no es necesariamente factible.
El problema se ha considerado recientemente en el contexto de estimadores sesgados para MCMC, como por ejemplo en el enfoque de Glynn-Rhee . Y el estimador de la ruleta rusa (con una conexión con el problema de fábrica de Bernoulli). Y la metodología imparcial de MCMC . Pero no hay escapatoria al problema de los signos ... Lo que dificulta su uso al estimar densidades como en los métodos pseudo-marginales.
fuente
Tengo el borrador de una idea que podría funcionar. No es exacto , pero con suerte asintóticamente exacto. Para convertirlo en un método realmente riguroso, donde se controle la aproximación, o se pueda probar algo al respecto, probablemente se necesite mucho trabajo.
Nota sobre un método exacto:
fuente