Esta pregunta está inspirada en este artículo .
Actualmente paso mucho tiempo en R para analizar datos. Algunos de los scripts que ejecuto en R podrían beneficiarse de la computación paralela para ahorrar tiempo. Digamos que podría construir una computadora básica "real" por unos ~ $ 300 y por esos mismos $ 300 podría obtener 6 Pis (incluido el cable de alimentación y la tarjeta SD). Suponiendo que tuviera una tarea adecuada para la paralelización, ¿sería mejor con el Pis o la computadora "real"?
¿Cambiaría la respuesta si aumentara el hardware de la computadora "real" a algo que puede costar $ 1000, ¿cómo sería eso contra 20 Pis?
Respuestas:
Si desea analizar esto, debe ir más allá de decir 20 rpis frente a $ 1000 y decidir por sí mismo lo que realmente puede obtener y usar por $ 1000. Tenga en cuenta que este no es el canal de compras.
Digamos que puede obtener una placa base, una fuente de alimentación, 8 GB de RAM, un procesador i7 de 6 núcleos a 3.4 Ghz y un disco duro viejo (¡aún más rápido que una tarjeta SD!) Por ~ $ 1000. Los ciclos totales por segundo serían 6 * 3.4e9 = 20.4e9, frente a 20 * 0.7e9 = 14e9 para la supercomputadora pi.
Ahora considere el hecho de que un procesador multinúcleo es un procesador multinúcleo, mientras que la E / S entre pis (si esto se convierte en un factor significativo) va a ser un orden de magnitud más lento.
Si bien no tengo un interés serio en (o conocimiento de) las supercomputadoras pi, supongo que son para experimentación y fines educativos. Definitivamente es un clúster barato, pero si su objetivo es reducir los números rápidamente (en lugar de experimentar y educar), no hay forma de que un clúster pi sea más rentable o económico que una PC normal.
fuente
Esto tiene una respuesta algo compleja: una pregunta clave que debe responder es "¿qué tipo de trabajo le pide a la máquina que haga?"
La instrucción se establece en diferentes máquinas (ARM vs Intel vs quien sea), así como la calidad de los compiladores hacen una gran diferencia en el rendimiento real. Si el trabajo que está pidiendo hacer tiene aceleración de hardware en una máquina pero no en otra, ese factor por sí solo va a hacer más diferencia que un cambio significativo en la velocidad del reloj.
En los términos más generales, creo que el mayor beneficio en términos de precio / rendimiento vendrá de una CPU general multinúcleo moderadamente sincronizada de AMD o Intel. Si se encuentra en un entorno controlado donde las temperaturas ambiente son bajas, es probable que pueda overclockear estos chips un poco para obtener más rendimiento.
El rasPi definitivamente NO está diseñado para este tipo de cosas, lo que no debería quitarle su alto valor en aprender cómo funcionan las cosas, e incluso construir un sistema verdaderamente "distribuido" a un precio muy asequible. Pero si lo que necesita hacer es un análisis serio de datos y / o números, es probable que rasPi no sea la opción correcta.
fuente
Dejando de lado la CPU con poca potencia en el pi, no puedo ver cómo va a llevar los datos a las CPU lo suficientemente rápido en docenas de pis para ver que las ganancias de rendimiento valen la pena. La velocidad del bus es tan importante en la supercomputación en clúster como la velocidad de la CPU, y el pi es muy inadecuado aquí.
Tanto la red como el acceso al disco compartirán el mismo bus USB2 de 60 MB. La tarjeta SD tiene, en el mejor de los casos, un rendimiento en el rango de velocidad de 20 MB.
El hardware de PC de gama baja con SATA a 150 MB y Ethernet en un bus PCI de 2 GB ofrece órdenes de magnitud más ancho de banda.
fuente
Si quieres aprender supercomputación entre nodos. .. Me gustaría configurar el pi. Si desea algo económico pero potente, compre un servidor / estación de trabajo Intel multinúcleo basado en Xenon usado y coloque una o más tarjetas Tesla o tarjetas Guda Cuda o tarjetas Intel Phi.
fuente