¿Es 1.0 una salida válida de std :: generate_canonical?

124

Siempre pensé que los números aleatorios estarían entre cero y uno, sin ellos1 , es decir, son números del intervalo medio abierto [0,1]. La documentación en cppreference.com de std::generate_canonicalconfirma esto.

Sin embargo, cuando ejecuto el siguiente programa:

#include <iostream>
#include <limits>
#include <random>

int main()
{
    std::mt19937 rng;

    std::seed_seq sequence{0, 1, 2, 3, 4, 5, 6, 7, 8, 9};
    rng.seed(sequence);
    rng.discard(12 * 629143 + 6);

    float random = std::generate_canonical<float,
                   std::numeric_limits<float>::digits>(rng);

    if (random == 1.0f)
    {
        std::cout << "Bug!\n";
    }

    return 0;
}

Me da el siguiente resultado:

Bug!

es decir, me genera un perfecto 1, lo que causa problemas en mi integración MC. ¿Es ese comportamiento válido o hay un error de mi parte? Esto da el mismo resultado con G ++ 4.7.3

g++ -std=c++11 test.c && ./a.out

y clang 3.3

clang++ -stdlib=libc++ -std=c++11 test.c && ./a.out

Si este es el comportamiento correcto, ¿cómo puedo evitarlo 1?

Edición 1 : G ++ de git parece sufrir el mismo problema. Estoy en

commit baf369d7a57fb4d0d5897b02549c3517bb8800fd
Date:   Mon Sep 1 08:26:51 2014 +0000

y compilando ~/temp/prefix/bin/c++ -std=c++11 -Wl,-rpath,/home/cschwan/temp/prefix/lib64 test.c && ./a.outda la misma salida, lddrendimientos

linux-vdso.so.1 (0x00007fff39d0d000)
libstdc++.so.6 => /home/cschwan/temp/prefix/lib64/libstdc++.so.6 (0x00007f123d785000)
libm.so.6 => /lib64/libm.so.6 (0x000000317ea00000)
libgcc_s.so.1 => /home/cschwan/temp/prefix/lib64/libgcc_s.so.1 (0x00007f123d54e000)
libc.so.6 => /lib64/libc.so.6 (0x000000317e600000)
/lib64/ld-linux-x86-64.so.2 (0x000000317e200000)

Edición 2 : informé el comportamiento aquí: https://gcc.gnu.org/bugzilla/show_bug.cgi?id=63176

Edición 3 : El equipo clang parece estar al tanto del problema: http://llvm.org/bugs/show_bug.cgi?id=18767

c++ c++11 random cschwan
fuente

@David Lively 1.f == 1.fen todos los casos (¿en qué casos están ahí? Ni siquiera he visto ninguna variable 1.f == 1.f; solo hay un caso aquí: 1.f == 1.fy eso es invariablemente true). Por favor, no difunda más este mito. Las comparaciones de punto flotante son siempre exactas.

R. Martinho Fernandes

@DavidLively: No, no lo es. La comparación siempre es exacta. Son sus operandos los que pueden no ser exactos si se calculan y no los literales.

Carreras de ligereza en órbita el

@Galik cualquier número positivo por debajo de 1.0 es un resultado válido. 1.0 no lo es. Es tan simple como eso. El redondeo es irrelevante: el código obtiene un número aleatorio y no realiza ningún redondeo en él.

R. Martinho Fernandes

@DavidLively está diciendo que solo hay un valor que se compara igual a 1.0. Ese valor es 1.0. Los valores cercanos a 1.0 no se comparan igual a 1.0. No importa lo que haga la función de generación: si devuelve 1.0, se comparará igual a 1.0. Si no devuelve 1.0, no se comparará igual a 1.0. Su ejemplo usando abs(random - 1.f) < numeric_limits<float>::epsiloncheques si el resultado es cercano a 1.0 , lo cual es totalmente incorrecto en este contexto: hay números cercanos a 1.0 que son resultados válidos aquí, a saber, todos aquellos que son menores a 1.0.

R. Martinho Fernandes

@Galik Sí, habrá problemas para implementar eso. Pero ese problema es para el implementador. El usuario nunca debe ver un 1.0, y el usuario siempre debe ver una distribución igual de todos los resultados.

R. Martinho Fernandes

Respuestas:

121

El problema está en el mapeo del codominio de std::mt19937( std::uint_fast32_t) a float; el algoritmo descrito por el estándar da resultados incorrectos (inconsistentes con su descripción de la salida del algoritmo) cuando se produce una pérdida de precisión si el modo de redondeo IEEE754 actual no es redondo a infinito negativo (tenga en cuenta que el valor predeterminado es redondo -al más cercano).

La salida 7549723a de mt19937 con su semilla es 4294967257 ( 0xffffffd9u), que cuando se redondea a flotación de 32 bits 0x1p+32, que es igual al valor máximo de mt19937, 4294967295 ( 0xffffffffu) cuando eso también se redondea a flotación de 32 bits.

El estándar podría garantizar un comportamiento correcto si especificara que al convertir de la salida de la URNG a la RealTypede generate_canonical, el redondeo debe realizarse hacia el infinito negativo; Esto daría un resultado correcto en este caso. Como QOI, sería bueno para libstdc ++ hacer este cambio.

Con este cambio, 1.0ya no se generará; en cambio, los valores límite 0x1.fffffep-Npara 0 < N <= 8se generarán con más frecuencia (aproximadamente 2^(8 - N - 32)por N, dependiendo de la distribución real de MT19937).

Yo recomendaría no usar floatcon std::generate_canonicaldirectamente; en lugar de generar el número en doubley luego redondear hacia el infinito negativo:

    double rd = std::generate_canonical<double,
        std::numeric_limits<float>::digits>(rng);
    float rf = rd;
    if (rf > rd) {
      rf = std::nextafter(rf, -std::numeric_limits<float>::infinity());
    }

Este problema también puede ocurrir con std::uniform_real_distribution<float>; la solución es la misma, para especializar la distribución doubley redondear el resultado hacia infinito negativo en float.

ecatmur
fuente

Calidad de implementación de @user: todas las cosas que hacen que una implementación conforme sea mejor que otra, por ejemplo, rendimiento, comportamiento en casos extremos, utilidad de los mensajes de error.

ecatmur

@supercat: para desviarse un poco, en realidad hay buenas razones para intentar hacer que las funciones sinusoidales sean lo más precisas posible para ángulos pequeños, por ejemplo, porque los pequeños errores en sin (x) pueden convertirse en grandes errores en sin (x) / x (que ocurre con bastante frecuencia en cálculos del mundo real) cuando x está cerca de cero. La "precisión adicional" cerca de los múltiplos de π generalmente es solo un efecto secundario de eso.

Ilmari Karonen

@IlmariKaronen: Para ángulos suficientemente pequeños, sin (x) es simplemente x. Mi graznido en la función seno de Java se relaciona con ángulos que son casi múltiplos de pi. Yo diría que el 99% del tiempo, cuando el código lo solicita sin(x), lo que realmente quiere es el seno de (π / Math.PI) veces x. Las personas que mantienen Java insisten en que es mejor tener un informe lento de rutina matemática que el seno de Math.PI es la diferencia entre π y Math.PI que hacer que informe un valor que es ligeramente menor, a pesar de que en el 99% de las aplicaciones sería mejor ...

supercat

@ecatmur Sugerencia; Actualice esta publicación para mencionar que std::uniform_real_distribution<float>sufre el mismo problema como consecuencia de esto. (Para que las personas que buscan uniform_real_distribution tengan este Q / A aparece).

@ecatmur, no estoy seguro de por qué quieres redondear hacia el infinito negativo. Como generate_canonicaldebería generar un número en el rango [0,1), y estamos hablando de un error en el que genera 1.0 ocasionalmente, ¿no sería tan efectivo redondear hacia cero?

Marshall Clow

Según el estándar, 1.0no es válido.

C ++ 11 §26.5.7.2 Plantilla de función generate_canonical

Cada función instanciada a partir de la plantilla descrita en esta sección 26.5.7.2 asigna el resultado de una o más invocaciones de un generador de números aleatorios uniforme suministrado ga un miembro del RealType especificado de modo que, si los valores producidos por g _ig están distribuidos uniformemente, el Los resultados de instanciación t _j , 0 ≤ t _j <1 , se distribuyen de la manera más uniforme posible como se especifica a continuación.

Yu Hao
fuente

+1 No puedo ver ningún defecto en el programa del OP, así que lo llamo un error libstdc ++ y libc ++ ... lo cual en sí mismo parece un poco improbable, pero ahí vamos.

ligereza corre en órbita el

-2

Me encontré con una pregunta similar con uniform_real_distribution, y así es como interpreto la redacción parsimoniosa de la Norma sobre el tema:

El estándar siempre define las funciones matemáticas en términos de matemáticas , nunca en términos de punto flotante IEEE (porque el estándar todavía finge que punto flotante podría no significar punto flotante IEEE). Entonces, cada vez que ve una redacción matemática en el Estándar, se trata de matemáticas reales , no de IEEE.

La norma dice que tanto uniform_real_distribution<T>(0,1)(g)y generate_canonical<T,1000>(g)debe devolver valores en el rango medio abierta [0,1). Pero estos son valores matemáticos . Cuando toma un número real en el rango medio abierto [0,1) y lo representa como punto flotante IEEE, bueno, una fracción significativa del tiempo se redondeará T(1.0).

Cuando Tes float(24 bits de mantisa), esperamos ver uniform_real_distribution<float>(0,1)(g) == 1.0faproximadamente 1 de cada 2 ^ 25 veces. Mi experimentación de fuerza bruta con libc ++ confirma esta expectativa.

template<class F>
void test(long long N, const F& get_a_float) {
    int count = 0;
    for (long long i = 0; i < N; ++i) {
        float f = get_a_float();
        if (f == 1.0f) {
            ++count;
        }
    }
    printf("Expected %d '1.0' results; got %d in practice\n", (int)(N >> 25), count);
}

int main() {
    std::mt19937 g(std::random_device{}());
    auto N = (1uLL << 29);
    test(N, [&g]() { return std::uniform_real_distribution<float>(0,1)(g); });
    test(N, [&g]() { return std::generate_canonical<float, 32>(g); });
}

Salida de ejemplo:

Expected 16 '1.0' results; got 19 in practice
Expected 16 '1.0' results; got 11 in practice

Cuando Tes double(53 bits de mantisa), esperamos ver uniform_real_distribution<double>(0,1)(g) == 1.0aproximadamente 1 de cada 2 ^ 54 veces. No tengo la paciencia para probar esta expectativa. :)

Tengo entendido que este comportamiento está bien. Puede ofender nuestro sentido de "rango medio abierto" de que una distribución que dice devolver números "menores que 1.0" puede de hecho devolver números que son iguales a 1.0; pero esos son dos significados diferentes de "1.0", ¿ves? El primero es el matemático 1.0; el segundo es el número de coma flotante de precisión simple IEEE 1.0. Y nos han enseñado durante décadas a no comparar números de punto flotante para la igualdad exacta.

Cualquier algoritmo en el que alimente los números aleatorios no le importará si a veces es exacto 1.0. No hay nada que pueda hacer con un número de punto flotante, excepto las operaciones matemáticas, y tan pronto como realice alguna operación matemática, su código tendrá que lidiar con el redondeo. Incluso si pudieras asumir eso legítimamente generate_canonical<float,1000>(g) != 1.0f, aún no podrías asumir eso generate_canonical<float,1000>(g) + 1.0f != 2.0f, debido al redondeo. Simplemente no puedes alejarte de eso; Entonces, ¿por qué fingiríamos en esta única instancia que puedes?

Quuxplusone
fuente

Estoy totalmente en desacuerdo con esta opinión. Si el estándar dicta valores a partir de un intervalo medio abierto y una implementación rompe esta regla, la implementación es incorrecta. Desafortunadamente, como ecatmur señaló correctamente en su respuesta, el estándar también dicta el algoritmo que tiene un error. Esto también se reconoce oficialmente aquí: open-std.org/jtc1/sc22/wg21/docs/lwg-active.html#2524

cschwan

@cschwan: Mi interpretación es que la implementación no está rompiendo la regla. El estándar dicta valores de [0,1); la implementación devuelve valores de [0,1); algunos de esos valores se redondean a IEEE, 1.0fpero eso es inevitable cuando los lanzas a flotadores IEEE. Si desea resultados matemáticos puros, use un sistema de cálculo simbólico; Si está tratando de usar el punto flotante IEEE para representar números que están dentro epsde 1, está en un estado de pecado.

Quuxplusone

Ejemplo hipotético que se rompería con este error: divide algo entre canonical - 1.0f. Por cada flotante representable [0, 1.0), x-1.0fno es cero. Con exactamente 1.0f, puede obtener una división por cero en lugar de solo un divisor muy pequeño.

Peter Cordes