¿Secuencia de Halton vs secuencia de Sobol?

De una respuesta en una pregunta anterior , fui dirigido hacia la secuencia de Halton, para crear un conjunto de vectores que cubrieran un espacio de muestra uniforme de manera bastante uniforme. Pero la página de wikipedia menciona que los números primos más altos a menudo están altamente correlacionados al principio de la serie. Este parece ser el caso para cualquier par de primos altos con un tamaño de muestra relativamente corto, e incluso cuando las variables no están correlacionadas, el espacio muestral no se muestrea de manera uniforme, sino que hay bandas diagonales de alta densidad de muestra en todo el espacio .

Debido a que estoy usando vectores de longitud 6 o más, inevitablemente tendré que usar algunos números primos para los que esto es un problema (aunque no tan malo como en el ejemplo anterior), y algunos pares de variables se muestrearán de manera no uniforme su plano de muestra. El uso de la secuencia de Sobol para generar un conjunto similar me parece (solo al mirar gráficos) generar muestras entre pares de variables que están distribuidas de manera mucho más uniforme, incluso para cantidades relativamente pequeñas de muestras. Esto parece mucho más útil, por lo que me pregunto cuándo sería más beneficiosa una secuencia de Halton. ¿O es solo que la secuencia de Halton es más fácil de calcular?

Nota: la discusión de otras secuencias multidimensionales de baja discrepancia también es bienvenida.

sampling small-sample quasi-monte-carlo nada101
fuente

Respuestas:

Sí, Halton es más fácil de calcular, pero tiene los problemas que mencionaste. Halton se puede mejorar con el método saltado de Halton, pero no será realmente mejor que Sobol. Para dimensiones altas (como ) y conteo moderado (como alrededor de 500), todos los métodos tendrán problemas, por ejemplo, algunas proyecciones 2D en Sobol se verán extrañas, mostrando patrones fuertes, no diagonales, ¡sino más bien como un tablero de ajedrez! Una forma de mejorar es la aleatorización y, por ejemplo, la llamada transformación de la tienda. $d>10$ $N$

usuario32038
fuente

¿Podría por favor ampliar su última oración?

naught101