Xeon vs i7 Extreme overclockeado para la latencia más baja

9

Soy consciente de que las diferencias entre i7 de gama alta y Xeon son:

  1. compatibilidad con placas base de doble zócalo,
  2. tamaño total de caché L2 / L3.
  3. capacidad de overclocking.
  4. núcleos adicionales: Haswell i7-4960X vs E7.
  5. el consumo de energía.

(Ver: ¿Cuál es la diferencia entre un procesador Intel i7 y un procesador de cuatro núcleos Xeon? )

Lo que me gustaría preguntar es, ¿cuáles son las implicaciones del tamaño del caché para lograr la latencia más baja?

Parece que preferiría tener un i7 Extreme muy overclockeado que un procesador Xeon y no puedo imaginar cómo un caché adicional de 5 ~ 15 MB hará una diferencia significativa, excepto en algunos casos extremos donde el conjunto de problemas es demasiado grande para el caché L2 y lo suficientemente pequeño como para no depender de la memoria principal. ¿Me estoy perdiendo alguna ventaja de los procesadores Xeon?

PD: Estamos implementando hardware para detectores de neutrinos para física de alta energía y necesitamos un tiempo de respuesta muy rápido pero no grandes cálculos de matriz. Algunos señalarán que debería usar alguna estrategia ASIC / RISC + RTOS para lograr mis objetivos, pero la forma en que están diseñados los experimentos, solo necesito una latencia interna de 10 microsegundos (golpear el zócalo para salir), que parece posible con procesadores regulares .

elleciel
fuente
55
El verdadero cuello de botella sería la conexión entre el puerto de la computadora y el detector.
huseyin tugrul buyukisik
3
FPGA puede ser una solución mejor (y más barata) para dicha aplicación.
gronostaj
¿Puedes ser más preciso sobre cuándo comienzan y cuándo terminan los 10 microsegundos? Como señaló Huseyin, minimizar la latencia del hardware será crítico. El hardware y software de uso general es pésimo en esto.
David Schwartz
Eso es totalmente factible. Pero no ejecutes ventanas. Xeon no sería necesario. El overclocking probablemente no ayudará tanto como crees.
Matt H

Respuestas:

1

Anandtech hizo una revisión detallada del Core i7 4960x recientemente.

Latencia de memoria vs. Rango de acceso

Pero, sinceramente, estos tiempos no significan mucho sin saber qué tipo de algoritmo está utilizando. Asumiendo que no hay mucho procesamiento por hacer, entonces la conexión a Ethernet será el verdadero cuello de botella, como dijo @huseyin

cmorse
fuente
1

La única ventaja de los procesadores Xeon sobre i7 es la capacidad de manejo de memoria y su resistencia. i7 tiene ciertamente más frecuencia de reloj y no puede manejar gran cantidad de memoria. La memoria caché adicional solo hace que la memoria física pueda manejar grandes datos y procesamiento de E / S. También Hyper-threading hace eso por Intel. Solo mostrará una diferencia si va a controlar directamente el procesador mediante su algoritmo.

Si no está seguro de utilizar la estrategia ASIC / RISC + RTOS, puede seguir adelante con cualquier sistema operativo de 64 bits basado en Linux en el procesador Intel® Core ™ i7-990X Extreme Edition (caché de 12M, 3,46 GHz, 6,40 GT / s Intel® QPI ) el mejor ofrecido por Intel.

Además, si está pensando en usar el procesador para una gran cantidad de datos en un futuro próximo, mi elección será definitivamente el procesador Intel® Xeon® E7-8870 (caché de 30M, 2,40 GHz, 6,40 GT / s Intel® QPI) . esto tiene una frecuencia de reloj menor y, por lo tanto, más latencia.

Shashank Bajpai
fuente
1

Recomiendo un cRIO de Nation Instruments . Tiene una CPU Intel i7 y una FPGA. Puede ejecutar Windows, Linux o un RTOS. Puede programarlo en un lenguaje de alto nivel y ejecutar código en el i7 o en el FPGA. La conectividad de hardware de bajo nivel a sus sensores le dará una latencia mucho más baja que cualquier PC.

Monstieur
fuente