¿Cuáles son algunas técnicas para muestrear dos variables aleatorias correlacionadas?

16

¿Cuáles son algunas técnicas para muestrear dos variables aleatorias correlacionadas?

  • si sus distribuciones de probabilidad están parametrizadas (por ejemplo, log-normal)

  • si tienen distribuciones no paramétricas.

Los datos son dos series de tiempo para las cuales podemos calcular coeficientes de correlación distintos de cero. Deseamos simular estos datos en el futuro, suponiendo que la correlación histórica y la serie temporal CDF es constante.

Para el caso (2), el análogo 1-D sería construir el CDF y tomar muestras de él. Así que supongo que podría construir un CDF 2-D y hacer lo mismo. Sin embargo, me pregunto si hay una manera de acercarse utilizando los CDF 1-D individuales y vinculando de alguna manera las selecciones.

¡Gracias!

Pete
fuente
3
Vincular CDF 1-D me hace pensar en cópulas . No estoy seguro si serían de alguna utilidad para usted.
parada

Respuestas:

23

Creo que lo que estás buscando es una cópula. Tiene dos distribuciones marginales (especificadas por cdfs paramétricos o empíricos) y ahora desea especificar la dependencia entre los dos. Para el caso bivariado hay todo tipo de opciones, pero la receta básica es la misma. Usaré una cópula gaussiana para facilitar la interpretación.

Para extraer de la cópula gaussiana con la matriz de correlación C

  1. Draw (Z=(Z1,Z2)N(0,C)

  2. Establezca para i = 1 , 2 (con Φ el cdf normal estándar). Ahora U 1 , U 2U [ 0 , 1 ] , pero son dependientes.Ui=Φ(Zi)i=1,2ΦU1,U2U[0,1]

  3. Establezca donde F - 1 i es el (pseudo) inverso del marginal cdf para la variable i . Esto implica que Y i sigue la distribución deseada (este paso es solo un muestreo de transformación inversa).Yi=Fi1(Ui)Fi1iYi

Voila! Pruébelo para algunos casos simples y observe histogramas marginales y diagramas de dispersión, es divertido.

Sin embargo, no hay garantía de que esto sea apropiado para su aplicación en particular (en particular, es posible que deba reemplazar la cópula gaussiana por la cópula), pero esto debería ayudarlo a comenzar. Una buena referencia sobre el modelado de cópula es Nelsen (1999), Introducción a las cópulas , pero también hay algunas presentaciones bastante buenas en línea.

JMS
fuente
2
+1 Nelsen es bastante legible. Compré una copia hace unos años, incluso después de revisar muchos de los materiales en línea.
whuber
1
Encontré un excelente tutorial y una hoja de cálculo: behan.ws/copula.pdf y soa.org/files/xls/rsrch-copula-ex.xls
Pete
1
@Pete, el papel es realmente agradable. El enlace de la hoja de cálculo, por otro lado, está muerto
Boris Gorelik
¿Parece que las versiones recientes de Mathematica y Matlab ya tienen funciones incorporadas que manejan este problema?
LCFactorization
¿Qué hacer si quiero hacer lo mismo con una cópula plackett? ¿Existe alguna relación entre la cópula normal y la plackett?
fedvasu
2

X1Y+ZX2W+ZZU(1U)

Un tercer método popular es (NORTA) NORmal To Anything ; generar variables normales correlacionadas, convertirlas en variables aleatorias uniformes mediante la evaluación de sus respectivos cdfs, luego usar estas "nuevas" variables aleatorias uniformes como fuente de aleatoriedad al generar sorteos a partir de la nueva distribución.

Además del enfoque de cópula (una clase completa de métodos) mencionado en otra publicación, también puede tomar muestras de la distribución de acoplamiento máxima que es similar en espíritu al enfoque de cópula. Usted especifica distribuciones marginales y la muestra del acoplamiento máximo. Esto se logra mediante 2 pasos de aceptar-rechazar como lo describe Pierre Jacob aquí . Presumiblemente, este método puede extenderse a dimensiones superiores a 2 pero podría ser más complicado de lograr. Tenga en cuenta que el acoplamiento máximo inducirá una correlación que depende de los valores de los parámetros de los marginales. Consulte esta publicación para ver un buen ejemplo de esto en la respuesta de Xi'an a mi pregunta.

Si está dispuesto a aceptar muestras aproximadas (en la mayoría de los casos), las técnicas MCMC también son una opción para tomar muestras de distribuciones multidimensionales.

Además, podría usar métodos de aceptación-rechazo , pero generalmente es difícil encontrar una densidad dominante de la que tomar muestras y evaluar su relación con la densidad deseada.

Estos son todos los métodos adicionales que se me ocurren, pero probablemente haya un par que me perdí.

Lucas Roberts
fuente