¿Es una supercomputadora construida a partir de muchos RPis realmente práctica o simplemente una novedad?

13

Esta pregunta está inspirada en este artículo .

Actualmente paso mucho tiempo en R para analizar datos. Algunos de los scripts que ejecuto en R podrían beneficiarse de la computación paralela para ahorrar tiempo. Digamos que podría construir una computadora básica "real" por unos ~ $ 300 y por esos mismos $ 300 podría obtener 6 Pis (incluido el cable de alimentación y la tarjeta SD). Suponiendo que tuviera una tarea adecuada para la paralelización, ¿sería mejor con el Pis o la computadora "real"?

¿Cambiaría la respuesta si aumentara el hardware de la computadora "real" a algo que puede costar $ 1000, ¿cómo sería eso contra 20 Pis?

Dean MacGregor
fuente
El Pi es una computadora lenta con poco ram pero una buena Gpu. Si sus tareas se benefician de eso, puede tener sentido.
Thorbjørn Ravn Andersen
La GPU solo es beneficiosa si desea hacer algo para lo que ya hay código, o si puede negociar el acceso a la documentación de programación de GPU patentada.
Chris Stratton

Respuestas:

10

Si desea analizar esto, debe ir más allá de decir 20 rpis frente a $ 1000 y decidir por sí mismo lo que realmente puede obtener y usar por $ 1000. Tenga en cuenta que este no es el canal de compras.

Digamos que puede obtener una placa base, una fuente de alimentación, 8 GB de RAM, un procesador i7 de 6 núcleos a 3.4 Ghz y un disco duro viejo (¡aún más rápido que una tarjeta SD!) Por ~ $ 1000. Los ciclos totales por segundo serían 6 * 3.4e9 = 20.4e9, frente a 20 * 0.7e9 = 14e9 para la supercomputadora pi.

Ahora considere el hecho de que un procesador multinúcleo es un procesador multinúcleo, mientras que la E / S entre pis (si esto se convierte en un factor significativo) va a ser un orden de magnitud más lento.

Si bien no tengo un interés serio en (o conocimiento de) las supercomputadoras pi, supongo que son para experimentación y fines educativos. Definitivamente es un clúster barato, pero si su objetivo es reducir los números rápidamente (en lugar de experimentar y educar), no hay forma de que un clúster pi sea más rentable o económico que una PC normal.

Ricitos de oro
fuente
Gracias, "Los ciclos totales por segundo serían 6 * 3.4e9 = 20.4e9, frente a 20 * 0.7e9 = 14e9 para la supercomputadora pi". es básicamente lo que buscaba pero no sabía qué buscar.
Dean MacGregor
One Pi solo usa 5 vatios. Esto significa que 20 pis solo usan 100 vatios, que es menos que la PC que describe, por lo que es más eficiente en cuanto a costos y energía (pero con menos CPU :))
Thorbjørn Ravn Andersen
@ ThorbjørnRavnAndersen desde mi experiencia, 8 Core i7 + SSD drive + 16GB de RAM usan aproximadamente 50-70Wt dependiendo de la carga del procesador en una instalación sin cabeza (sin el monitor).
lenik
Cuando usa RPi2, la cantidad de ciclos aumentaría a 20 * 4 * 0.9e9 = 72e9, con el overclocking incluso puede alcanzar 20 * 4 * 1.1e9 = 88e9 ciclos por segundo. Ahora, con este aumento del poder computacional del pi, ¿crees que valdría la pena construir un RPi-Cluster?
Sirac
1
@goldilocks 1) Mi conocimiento sobre las supercomputadoras no es bueno para discutir sobre la velocidad de Mbps. 2) Sobre todo, una CPU Intel podría ser más rápida que un conjunto de ARMv7 por el mismo precio. Tengo que buscar algunas estadísticas para tener una mejor visión de esto. 3) Me toma horas compilar un kernel en un RPi2, lo probé y espero no volver a hacerlo en el futuro. En resumen, un RPi podría no ser la elección perfecta para una supercomputadora, incluso no el RPi2. Pero seguro que es un buen proyecto, ya que el RPi es muy barato y puedes combinar fácilmente varios de ellos. Estoy pensando en una simulación de red, porque puedes ...
Sirac
2

Esto tiene una respuesta algo compleja: una pregunta clave que debe responder es "¿qué tipo de trabajo le pide a la máquina que haga?"

La instrucción se establece en diferentes máquinas (ARM vs Intel vs quien sea), así como la calidad de los compiladores hacen una gran diferencia en el rendimiento real. Si el trabajo que está pidiendo hacer tiene aceleración de hardware en una máquina pero no en otra, ese factor por sí solo va a hacer más diferencia que un cambio significativo en la velocidad del reloj.

En los términos más generales, creo que el mayor beneficio en términos de precio / rendimiento vendrá de una CPU general multinúcleo moderadamente sincronizada de AMD o Intel. Si se encuentra en un entorno controlado donde las temperaturas ambiente son bajas, es probable que pueda overclockear estos chips un poco para obtener más rendimiento.

El rasPi definitivamente NO está diseñado para este tipo de cosas, lo que no debería quitarle su alto valor en aprender cómo funcionan las cosas, e incluso construir un sistema verdaderamente "distribuido" a un precio muy asequible. Pero si lo que necesita hacer es un análisis serio de datos y / o números, es probable que rasPi no sea la opción correcta.

ljwobker
fuente
1

Dejando de lado la CPU con poca potencia en el pi, no puedo ver cómo va a llevar los datos a las CPU lo suficientemente rápido en docenas de pis para ver que las ganancias de rendimiento valen la pena. La velocidad del bus es tan importante en la supercomputación en clúster como la velocidad de la CPU, y el pi es muy inadecuado aquí.

Tanto la red como el acceso al disco compartirán el mismo bus USB2 de 60 MB. La tarjeta SD tiene, en el mejor de los casos, un rendimiento en el rango de velocidad de 20 MB.

El hardware de PC de gama baja con SATA a 150 MB y Ethernet en un bus PCI de 2 GB ofrece órdenes de magnitud más ancho de banda.

sal
fuente
3
Esto depende completamente de la aplicación: algunas aplicaciones tienen relaciones muy altas de "trabajo" a "comunicación" y otras requieren mucha más comunicación por cantidad de trabajo realizado.
Chris Stratton
0

Si quieres aprender supercomputación entre nodos. .. Me gustaría configurar el pi. Si desea algo económico pero potente, compre un servidor / estación de trabajo Intel multinúcleo basado en Xenon usado y coloque una o más tarjetas Tesla o tarjetas Guda Cuda o tarjetas Intel Phi.

Jay Wolfe
fuente