La pregunta es ¿qué quieres decir con flops? Si lo único que le importa es cuántas de las operaciones de coma flotante más simples por reloj, probablemente sea el triple de su velocidad de reloj, pero eso es tan insignificante como los bogomips. Algunas operaciones de coma flotante tardan mucho tiempo (dividir, para empezar), sumar y multiplicar suelen ser rápidas (una por unidad de fp por reloj). El siguiente problema es el rendimiento de la memoria, hay una razón por la cual el último CRAY clásico tenía 31 bancos de memoria, en última instancia, el rendimiento de la CPU está limitado por la rapidez con que puede leer y escribir en la memoria, entonces, ¿en qué nivel de almacenamiento en caché encaja su problema? Linpack fue un punto de referencia real una vez, ahora cabe en la memoria caché (L2 si no es L1) y es más un punto de referencia teórico de CPU puro. Y, por supuesto, sus unidades SSE (etc.) también pueden agregar rendimiento de punto flotante.
¿Qué distribución corres?
Esto parecía un buen puntero: http://linuxtoolkit.blogspot.com/2009/04/intel-optimized-linpack-benchmark-for.html
http://onemansjourneyintolinux.blogspot.com/2008/12/show-us-yer-flops.html
http://www.phoronix-test-suite.com/ podría ser una forma más fácil de instalar un punto de referencia de flops.
Aún así, me pregunto por qué te importa, ¿para qué lo estás usando? Si solo desea un número sin sentido, sus bogomips de sistemas todavía están ahí en dmesg.
aparentemente hay un paquete de referencia "sysbench" y un comando:
sudo apt-get install sysbench
(obrew install sysbench
OS X)ejecutarlo así:
sysbench --test=cpu --cpu-max-prime=20000 --num-threads=2 run
salida para comparaciones:
ref: http://www.midwesternmac.com/blogs/jeff-geerling/2013-vps-benchmarks-linode
fuente
Para estimaciones aproximadas:
Raspberry Pi 2 : 299.93 * 10 ^ 6 FLOPS ( fuente )
Raspberry Pi 3: 462.07 * 10 ^ 6 FLOPS ( fuente )
Linpack
cd benchmarks_2017/linux/mkl/benchmarks/linpack
./runme_xeon64
En un Thinkpad T460p ( CPU Intel i7-6700HQ ), proporciona:
fuente
Un punto de referencia que se ha utilizado tradicionalmente para medir FLOPS es Linpack. Otro punto de referencia común de FLOPS es Whetstone.
Más información: la entrada de Wikipedia "FLOPS" , la entrada de Whetstone , la entrada de Linpack
fuente
Recomiendo encarecidamente la compilación de linpack lista para ejecutar de Intel: http://software.intel.com/en-us/articles/intel-math-kernel-library-linpack-download/
fuente
Como menciona el clúster, hemos utilizado la suite HPCC . Se necesita un poco de esfuerzo para configurar y ajustar, pero en nuestro caso el punto no era alardear per se, era parte de los criterios de aceptación para el clúster; alguna evaluación comparativa de rendimiento es vital en mi humilde opinión para garantizar que el hardware funciona como se anuncia, todo está conectado correctamente, etc.
Ahora, si solo quieres un número máximo de FLOPS teórico, ese es fácil. Simplemente consulte un artículo sobre la CPU (por ejemplo, en realworldtech.com o somesuch) para obtener información sobre cuántos DP FLOPS puede hacer un núcleo de CPU por ciclo de reloj (con CPU x86 actuales que normalmente son 4). Entonces, el pico total FLOPS es solo
número de núcleos * FLOPS / ciclo * frecuencia
Luego, para un clúster con red IB, debería poder alcanzar alrededor del 80% de los FLOPS máximos en HPL (que por cierto es uno de los puntos de referencia en HPCC).
fuente