IPoIB (IP sobre InfiniBand) vs. rendimiento RDMA

8

En parte heredé un clúster HA de Linux en el centro del cual actualmente sirve una conexión con DRBD 8 sobre IPoIB (IP sobre InfiniBand) entre dos hosts Debian. No está roto, así que no lo arreglaré.

También he notado que DRBD 9 admite RDMA, por lo que puede surgir la pregunta de si se debe reemplazar la conexión con DRBD 9 sobre RDMA (es decir, InfiniBand "nativo") en el futuro.

Como no quiero ejecutar pruebas de rendimiento en un sistema de producción, me pregunto: ¿hay comparaciones de rendimiento publicadas para IPoIB frente a RDMA / InfiniBand? Por ejemplo, ¿podría esperar ganancias de ancho de banda / latencia al cambiar de IPoIB en órdenes de magnitud de 10%, 50% o 100%, por ejemplo? ¿Qué se puede esperar?

rookie09
fuente

Respuestas:

6

has visto estas presentaciones? https://www.linbit.com/en/drbd-9-over-rdma-with-micron-ssds/ http://downloads.openfabrics.org/Media/Monterey_2015/Tuesday/tuesday_09_ma.pdf

InfiniBand es solo una arquitectura de red específica que ofrece RDMA, pero su rendimiento dependerá del tipo de aplicaciones que esté ejecutando. Mi experiencia se basa en sistemas académicos / de investigación que utilizan principalmente aplicaciones basadas en MPI. En ciertos casos, he visto que RDMA funciona un 20% mejor que IPoIB. Pero no estoy al tanto de ninguna evaluación comparativa de este tipo, pero hay muchos trabajos académicos escritos y también informes de proveedores. Si solo está pensando en E / S, considere: tamaños de archivo, número de lecturas frente a escrituras. RDMA usualmente proporcionó un gran beneficio para lecturas pequeñas aleatorias, pero solo un pequeño beneficio para escrituras. Es posible que desee leer en RoCE (RDMA a través de Ethernet convergente) y RDMA nativa InfiniBand.

Tux_DEV_NULL
fuente
Gracias, esp. para la cantidad del 20%. La aplicación que se ejecuta en la parte superior es PostgreSQL. (Su pgdata reside en el dispositivo DRBD.)
rookie09
2
Sí a todo eso. No puede ir más rápido que los discos en su sistema, pero suponiendo que esté seguro de que los discos son más rápidos que la red en la que se replican, entonces probablemente podrá sacar un poco más de rendimiento del sistema cambio a RDMA.
Matt Kereczman el
44
Aquí hay otra explicación (alternativa) de RDMA que podría ser de su interés starwindsoftware.com/…
Net Runner