Tenemos una gran variedad de métodos para la generación aleatoria a partir de distribuciones univariadas (transformación inversa, aceptar-rechazar, Metropolis-Hastings, etc.) y parece que podemos tomar muestras de literalmente cualquier distribución válida, ¿es eso cierto?
¿Podría proporcionar algún ejemplo de distribución univariada que sea imposible generar aleatoriamente? Creo que el ejemplo donde es imposible no existe (?), Así que digamos que por "imposible", nos referimos también casos que son muy caros computacionalmente, por ejemplo, que las simulaciones necesidad de fuerza bruta como el dibujo de grandes cantidades de muestras para aceptar sólo una pocos de ellos.
Si tal ejemplo no existe, ¿podemos realmente demostrar que podemos generar sorteos aleatorios a partir de cualquier distribución válida? Simplemente tengo curiosidad si existe un contraejemplo para esto.
Respuestas:
Si conoce la función de distribución acumulativa, , puede invertirla, ya sea analítica o numéricamente, y utilizar el método de muestreo de transformación inversa para generar muestras aleatorias https://en.wikipedia.org/wiki/Inverse_transform_sampling .F( x )
Defina . Esto manejará cualquier distribución, ya sea continua, discreta o cualquier combinación. Esto siempre se puede resolver numéricamente, y quizás analíticamente. Sea U una muestra de una variable aleatoria distribuida como Uniforme [0,1], es decir, de un generador de números aleatorios uniforme [0,1]. Entonces , definido como arriba, es una muestra aleatoria de una variable aleatoria que tiene distribución . F - 1 ( U ) F ( x )F- 1( y) = i n f( x : F( x ) ≥ y) F- 1( U) F( x )
Puede que esta no sea la forma más rápida de generar muestras aleatorias, pero es una forma, suponiendo que se conoce F (x).
Si no se conoce F (x), entonces esa es una historia diferente.
fuente
Cuando una distribución solo se define por su función generadora de momentos o por su función característica Φ ( t ) = E [ exp { i t X } ] , es raro encontrar formas de generar a partir de esas distribuciones.ϕ ( t ) = E [ exp{ t X} ] Φ ( t ) = E [ exp{ i t X} ]
Se hace un ejemplo relevante de distribuciones estables enα , que no tienen forma conocida de densidad o cdf, no tienen función generadora de momento, sino una función característica de forma cerrada.
En las estadísticas bayesianas, las distribuciones posteriores asociadas con probabilidades intratables o simplemente conjuntos de datos que son demasiado grandes para caber en una computadora pueden considerarse imposibles (exactamente) de simular.
fuente
Suponiendo que se refiera a distribuciones continuas. Al usar la transformación integral de probabilidad , puede simular desde cualquier distribución univariada simulando u ∼ ( 0 , 1 ) y luego tomando F - 1 ( u ) . Entonces, podemos simular un uniforme, entonces esa parte está hecha. Lo único que puede impedir la simulación de F es que no se puede calcular su F - 1 inversa , pero esto tiene que estar relacionado con dificultades computacionales, en lugar de algo teórico.F u∼(0,1) F−1(u) F F−1
fuente
Hay métodos para tomar muestras aproximadamente de este posterior en algunos casos, pero no existe un método general exacto en este momento.
fuente
fuente
Si solo está interesado en muestrear variables aleatorias cuyos valores pueden aproximarse razonablemente por números de coma flotante de 64 bits, o si tiene una tolerancia similar al error finito en el valor, y de todos modos no representaba sus muestras en máquinas de Turing , considera esto:
En este caso, la respuesta obvia parece obvia:
Un poco más formalmente: le doy una gran instancia de un problema NP-complete (o EXP-complete, etc.) y le pido que muestree uniformemente el conjunto de soluciones para mí.
Puede verificar fácilmente si una asignación de verdad dada satisface mi instancia de SAT, y después de haberlos verificado, ya sabe si alguien lo hace, por lo que he especificado completamente un CDF al darle una fórmula booleana (o circuito), pero para probar la distribución correspondiente esencialmente debes convertirte en algo al menos tan poderoso como un oráculo de solubilidad SAT.
Así que te di un número indiscutible que debería arrojar arena en tus engranajes, y te di un CDF que es lento de calcular. Tal vez la siguiente pregunta obvia es: ¿hay un CDF representado en alguna forma eficiente (por ejemplo, puede evaluarse en tiempo polinómico) de modo que sea difícil generar muestras con esa distribución? No sé la respuesta a esa. No sé la respuesta a esa.
fuente