De una respuesta en una pregunta anterior , fui dirigido hacia la secuencia de Halton, para crear un conjunto de vectores que cubrieran un espacio de muestra uniforme de manera bastante uniforme. Pero la página de wikipedia menciona que los números primos más altos a menudo están altamente correlacionados al principio de la serie. Este parece ser el caso para cualquier par de primos altos con un tamaño de muestra relativamente corto, e incluso cuando las variables no están correlacionadas, el espacio muestral no se muestrea de manera uniforme, sino que hay bandas diagonales de alta densidad de muestra en todo el espacio .
Debido a que estoy usando vectores de longitud 6 o más, inevitablemente tendré que usar algunos números primos para los que esto es un problema (aunque no tan malo como en el ejemplo anterior), y algunos pares de variables se muestrearán de manera no uniforme su plano de muestra. El uso de la secuencia de Sobol para generar un conjunto similar me parece (solo al mirar gráficos) generar muestras entre pares de variables que están distribuidas de manera mucho más uniforme, incluso para cantidades relativamente pequeñas de muestras. Esto parece mucho más útil, por lo que me pregunto cuándo sería más beneficiosa una secuencia de Halton. ¿O es solo que la secuencia de Halton es más fácil de calcular?
Nota: la discusión de otras secuencias multidimensionales de baja discrepancia también es bienvenida.
fuente