¿Cuáles son algunas técnicas para muestrear dos variables aleatorias correlacionadas?
si sus distribuciones de probabilidad están parametrizadas (por ejemplo, log-normal)
si tienen distribuciones no paramétricas.
Los datos son dos series de tiempo para las cuales podemos calcular coeficientes de correlación distintos de cero. Deseamos simular estos datos en el futuro, suponiendo que la correlación histórica y la serie temporal CDF es constante.
Para el caso (2), el análogo 1-D sería construir el CDF y tomar muestras de él. Así que supongo que podría construir un CDF 2-D y hacer lo mismo. Sin embargo, me pregunto si hay una manera de acercarse utilizando los CDF 1-D individuales y vinculando de alguna manera las selecciones.
¡Gracias!
Respuestas:
Creo que lo que estás buscando es una cópula. Tiene dos distribuciones marginales (especificadas por cdfs paramétricos o empíricos) y ahora desea especificar la dependencia entre los dos. Para el caso bivariado hay todo tipo de opciones, pero la receta básica es la misma. Usaré una cópula gaussiana para facilitar la interpretación.
Para extraer de la cópula gaussiana con la matriz de correlaciónC
Draw(Z=(Z1,Z2)∼N(0,C)
Establezca para i = 1 , 2 (con Φ el cdf normal estándar). Ahora U 1 , U 2 ∼ U [ 0 , 1 ] , pero son dependientes.Ui=Φ(Zi) i=1,2 Φ U1,U2∼U[0,1]
Establezca donde F - 1 i es el (pseudo) inverso del marginal cdf para la variable i . Esto implica que Y i sigue la distribución deseada (este paso es solo un muestreo de transformación inversa).Yi=F−1i(Ui) F−1i i Yi
Voila! Pruébelo para algunos casos simples y observe histogramas marginales y diagramas de dispersión, es divertido.
Sin embargo, no hay garantía de que esto sea apropiado para su aplicación en particular (en particular, es posible que deba reemplazar la cópula gaussiana por la cópula), pero esto debería ayudarlo a comenzar. Una buena referencia sobre el modelado de cópula es Nelsen (1999), Introducción a las cópulas , pero también hay algunas presentaciones bastante buenas en línea.
fuente
Un tercer método popular es (NORTA) NORmal To Anything ; generar variables normales correlacionadas, convertirlas en variables aleatorias uniformes mediante la evaluación de sus respectivos cdfs, luego usar estas "nuevas" variables aleatorias uniformes como fuente de aleatoriedad al generar sorteos a partir de la nueva distribución.
Además del enfoque de cópula (una clase completa de métodos) mencionado en otra publicación, también puede tomar muestras de la distribución de acoplamiento máxima que es similar en espíritu al enfoque de cópula. Usted especifica distribuciones marginales y la muestra del acoplamiento máximo. Esto se logra mediante 2 pasos de aceptar-rechazar como lo describe Pierre Jacob aquí . Presumiblemente, este método puede extenderse a dimensiones superiores a 2 pero podría ser más complicado de lograr. Tenga en cuenta que el acoplamiento máximo inducirá una correlación que depende de los valores de los parámetros de los marginales. Consulte esta publicación para ver un buen ejemplo de esto en la respuesta de Xi'an a mi pregunta.
Si está dispuesto a aceptar muestras aproximadas (en la mayoría de los casos), las técnicas MCMC también son una opción para tomar muestras de distribuciones multidimensionales.
Además, podría usar métodos de aceptación-rechazo , pero generalmente es difícil encontrar una densidad dominante de la que tomar muestras y evaluar su relación con la densidad deseada.
Estos son todos los métodos adicionales que se me ocurren, pero probablemente haya un par que me perdí.
fuente