¿Cuál es el equivalente para los cdfs de MCMC para pdfs?

8

En conjunción con una pregunta de validación cruzada sobre la simulación a partir de una cópula específica, es decir, un cdf multivariado definido en , comencé a preguntarme sobre el panorama general, a saber, cómo cuando se le da tal función, ¿se puede calcular un algoritmo genérico para simular a partir de la distribución de probabilidad correspondiente?C(tu1,...,tuk)[0,1]k

Obviamente, una solución es diferenciar veces para producir el pdf correspondiente y luego llamar a un algoritmo MCMC genérico como Metropolis-Hastings para producir una muestra de (o ).C kκ(tu1,...,tuk)Cκ

Aparte: Otra solución es apegarse a las cópulas de Archimedian, usando la transformación de Laplace-Stieljes para la simulación, pero esto no siempre es posible en la práctica. Como encontré al tratar de resolver la pregunta anterior .

Mi pregunta es sobre evitar este paso diferenciador de una manera genérica, si es posible.

Xi'an
fuente
1
El vínculo "la transformación de Laplace-Stieljes" parece estar roto ahora.
jochen

Respuestas:

4

Este es un intento que no realicé por completo, pero fue demasiado largo para la sección de comentarios. Puede ser útil ponerlo aquí como otra alternativa básica para muy bajok. No requiere diferenciación explícita + MCMC (pero sí realiza diferenciación numérica, sin MCMC).

Algoritmo

Para pequeños ε>0 0:

  1. Dibujar tu1C1C(U1=tu1,U2=1,...,Uk=1). Esto se puede hacer fácilmente dibujandoηUniforme[0 0,1] y computación C1-1(η)(que, en todo caso, se puede hacer fácilmente numéricamente). Este es un sorteo del pdf marginaltu1κ(tu1).
  2. por j=2...k
    • Definir
      Dj(ε)(uj|u1,,uj1)Pr(u1ε2U1u1+ε2uj1ε2Uj1uj1+ε2UjujUj+11Uk1),
      que se puede calcular como una diferencia de C evaluado en varios puntos (que de manera ingenua necesita O(2j-1) evaluaciones de C por cada evaluación de rej(ε)) rej(ε) es el ε-condicional marginal aproximado de tuj dado tu1,...,tuj-1.
    • Dibujar tujrej(ε)(tujEl |tu1,...,tuj-1) según el punto 1, que nuevamente debería ser fácil de hacer con la inversión numérica.

Discusión

Este algoritmo debería generar muestras iid de un ε-aproximación de C(tu1,...,tuk), dónde εsimplemente depende de la precisión numérica. Existen tecnicismos prácticos para refinar la aproximación y hacerla numéricamente estable.

El problema obvio es que la complejidad computacional se escala como O(2k)Entonces, para decirlo generosamente, esto no es muy general en términos de k (pero el ejemplo que vinculó tenía k=3, entonces tal vez este método no sea completamente inútil: no estoy familiarizado con el escenario típico en el que tendrías acceso al cdf). Por otro lado, para distribuciones de muy baja dimensión, podría funcionar, y el costo se compensa por el hecho de que, a diferencia de la otra solución genérica de "diferenciación + MCMC", no hay necesidad de calcular derivados, las muestras son iid y allí no hay ajuste (aparte de la elección deε, que debería ser algo ligeramente superior a la precisión de la máquina). Y tal vez hay maneras de hacer esto mejor que el enfoque ingenuo.

Como mencioné, esto está fuera de mi alcance, por lo que podría haber otros problemas.

lacerbi
fuente