propósito de las supercomputadoras

15

El otoño pasado hice un recorrido por la supercomputadora Blue Waters en la Universidad de Illinois. Le pregunté si alguien alguna vez usó toda la computadora. Me dijeron que siempre estaba trabajando en múltiples proyectos. Eso me hizo preguntarme sobre la utilidad de las supercomputadoras. Quizás Blue Waters es inusual porque tiene que ser compartido por la industria y la universidad, no lo sé. Supongo que hay algunos gastos generales en la administración de los procesadores y la memoria de una sola supercomputadora. ¿Sería más rentable construir computadoras más pequeñas? ¿Alguien puede ayudarme a comprender el valor de las supercomputadoras? ¿O es que a veces se dedican a proyectos individuales?

Mitchell Kaplan
fuente
¿Puedes explicar cómo esta es una pregunta de informática? Afaik, la mayoría de los usuarios de supercomputadoras son personas de ciencias naturales y computación científica.
Raphael
@Raphael: esta es una pregunta sobre la asignación de recursos en el diseño de sistemas informáticos. Los usuarios de sistemas informáticos de cualquier tipo rara vez son informáticos.
Wandering Logic
1
¿Tiene más detalles sobre el uso de Blue Waters? Por ejemplo, suponga que generalmente hay un proyecto que usa el 90% de la computadora y otros pocos que eliminan el 10% restante: en ese caso, parece que la computadora tiene el tamaño correcto. Pero si generalmente hay 10 proyectos cada uno con un 10%, esa es una caldera de pescado completamente diferente.
David Richerby
2
A mí me suena a ciencia de la computación. Arquitectura de computadora, computación en clúster, computación en cuadrícula, etc. Todo relacionado y toda la informática.
Dave Clarke

Respuestas:

9

Un trabajo típico en Blue Waters es usar aproximadamente el 10% de la máquina y consume un total de 75 horas de nodo . Blue Waters tiene alrededor de 27500 nodos, lo que significa que algunos de esos trabajos de "75 horas de nodo" se ejecutan en solo un par de minutos. Eso permite a los científicos usar la máquina de forma algo interactiva. (Puede ver los promedios móviles aquí: http://xdmod.ncsa.illinois.edu/#tg_usage:group_by_Jobs_none )

Las supercomputadoras son solo grandes colecciones de computadoras más pequeñas. La razón principal por la que los reunimos en un solo lugar es que podemos compartir el costo de la manera más eficiente. Está tratando de crear una computadora que pueda hacer mucho trabajo y para la cual el costo total de propiedad (el costo total de la computadora, la energía y el mantenimiento) se minimice durante la vida útil de la computadora.

Hay varios factores involucrados en el costo total de propiedad: El costo del equipo es uno. Para minimizar el costo de propiedad, desea que el equipo realice un trabajo útil el mayor tiempo posible (idealmente el 100% del tiempo, de manera realista algo menos, como el 95% se consideraría bueno), hasta que el equipo se queme. o se vuelve obsoleto. Por el contrario, la computadora en su computadora portátil o su teléfono probablemente esté en uso menos del 10% del tiempo que lo posee (está dormido el 33% del tiempo, está comiendo y relajándose aproximadamente la mitad del tiempo que está despierto, y incluso cuando está "usando" la computadora, el procesador está inactivo la mayor parte del tiempo).

El segundo es el costo del poder. Hay varias partes de esto: la primera es el costo del poder en sí. Parte de ese costo se consume al transportar la energía desde la planta de energía a la computadora. Parte de ella se pierde en la "fuente de alimentación" de la computadora (que simplemente convierte la alimentación de CA en alimentación de CC). Un convertidor AC-> DC más grande generalmente se puede hacer más eficiente. Además, las computadoras convierten la energía eléctrica útil en calor residual. Por lo tanto, también debe pagar para eliminar el calor. Una vez más, los acondicionadores de aire más grandes generalmente se pueden hacer más eficientes que múltiples acondicionadores de aire pequeños.

El tercero es el costo de mantenimiento. Al juntar un montón de computadoras y diseñarlas para que, cuando una se caiga, el resto siga funcionando, puede amortizar el costo del personal de mantenimiento en una cantidad mucho mayor de nodos de computadora que si los nodos fueran todos diferentes y se ubicaran en diferentes edificios. (o ciudades).

Los detalles: Blue Waters tiene 288 gabinetes. Cada gabinete tiene 96 "nodos". Cada nodo es una computadora de gama alta bastante normal. La mayoría de los nodos tienen 2 procesadores AMD Opeteron 6276 que funcionan a 2.3GHz y 64GByte de DRAM. Aproximadamente 1/6 de los nodos tienen un solo AMD Opteron 6276, una GPU NVidia K20 y 38 GByte de DRAM. Si lo desea, puede comprar algo similar a un "nodo" por alrededor de $ 3000 o $ 4000 y ponerlo en su sala de estar para jugar videojuegos. Blue Waters tiene alrededor de 27648 nodos. https://bluewaters.ncsa.illinois.edu/hardware-summary

Cada nodo probablemente consume un poco más de 500 vatios y convierte esa energía en calor. Si tuviera un nodo en su sala de estar para jugar videojuegos, no sería un gran problema. Consumiría algo de electricidad de la toma de corriente y generaría casi tanto calor como un pequeño calentador de espacio personal. En el invierno sería agradable y acogedor. En el verano tendrías que usar tu aire acondicionado con más frecuencia para mantener tu casa cómoda. Si lo hiciera funcionar a toda potencia todo el día todos los días, su factura de electricidad aumentaría considerablemente, quizás el doble de lo que está consumiendo ahora.

Pero cuando juntas 27648 de ellas, consume aproximadamente 15 megavatios y genera una cantidad correspondientemente grande de calor. La verdadera maravilla de la ingeniería de Blue Waters, como cualquier gran centro de datos, es el edificio en sí. Es una enorme caja refrigerada. El edificio Blue Waters es particularmente interesante porque es increíblemente eficiente. Aproximadamente el 85% de la energía que entra al edificio se usa realmente para ejecutar los nodos. Creo que leí en alguna parte (no puedo encontrarlo en este momento) solo el 15% se pierde en la conversión de energía y eliminando el calor residual. Eso es mucho mejor de lo que obtendría de la computadora de juegos de 500 vatios en su sala de estar. Probablemente necesitará una "fuente de alimentación" de 750 vatios y otros doscientos vatios para hacer funcionar el aire acondicionado.

TL; DR

Pongámoslo todo junto. Al reunir miles de computadoras más pequeñas y difundir el uso entre muchas personas, mantenemos esas computadoras funcionando la mayor parte del tiempo, compartiendo los recursos de una manera muy eficiente. Cuesta mucho dinero dar a las personas computadoras que permanecen inactivas la mayor parte del tiempo. La mejor manera de ahorrar dinero en computación es hacer que las personas compartan las computadoras para que las computadoras estén ocupadas la mayor parte del tiempo.

Blue Waters es mucho más que las computadoras que contiene. Está especialmente diseñado para ser tan eficiente como sea posible. Parte de eso implica colocarlo cerca de plantas de energía para reducir las pérdidas de energía en las líneas de transmisión de energía. Aquí hay una imagen satelital de la parte de Champaign IL que contiene Blue Waters para demostrar: ingrese la descripción de la imagen aquí

Lógica Errante
fuente
4

Las supercomputadoras son extremadamente importantes en la investigación moderna. no siempre se utilizan a su capacidad total dependiendo de una dinámica de oferta / demanda / gestión y un ciclo continuo de actualización / reemplazo. hay supercomputadoras masivas utilizadas en la industria de defensa para simulaciones de armas (que coinciden con uno de los fundamentos / ímpetu iniciales para la invención de la computadora en la Segunda Guerra Mundial, calculando trayectorias de proyectiles). Este uso no es muy publicitado. Las simulaciones de armas modernas son para armas nucleares y están altamente clasificadas. las simulaciones permiten que los nuevos diseños de armas se "prueben" con precisión solo a través de simulaciones computacionales. Estados Unidos incluso rechaza la exportación de tecnología informática avanzada a otros países, por ejemplo, China por este motivo,

Hay muchos otros usos. se pueden usar para simular dinámicas de diseño de productos. por ejemplo, la compañía Tide necesitaba descubrir cómo mezclar diferentes ingredientes en su jabón de lavandería de manera óptima, y ​​se utilizaron supercomputadoras para ayudar a calcular la mezcla óptima.

La mayoría de las supercomputadoras implican ejecutar múltiples proyectos diferentes. se usan como recursos compartidos y la administración tiene estrategias para elegir proyectos en función de su carga general, valor de investigación, etc.

El valor básico de las supercomputadoras es que los cálculos a muy gran escala simplemente no pueden ejecutarse en computadoras "más pequeñas" con menos capacidad total de CPU. pero en la última década ha habido un cambio importante hacia la construcción de supercomputadoras con tecnología "comercial" (también conocida como COTS) que disminuye su precio y todavía tienen un rendimiento muy alto.

Wikipedia menciona los usos básicos de las supercomputadoras, esta es una lista parcial.

  • 1970 / Predicción del tiempo, investigación aerodinámica (Cray-1). [83]
  • Década de 1980 / Análisis probabilístico, [84] modelado de blindaje contra la radiación [85] (CDC Cyber).
  • Década de 1990 / Código de fuerza bruta rompiendo (EFF DES cracker). [86]
  • 2000 / Simulaciones de pruebas nucleares en 3D como un sustituto de la conducta legal Tratado de No Proliferación Nuclear (ASCI Q). [87]
  • Década de 2010 / Simulación de dinámica molecular (Tianhe-1A) [88]
vzn
fuente
1
en los últimos tiempos, las supercomputadoras tienen fuertes lazos con el trabajo en big data y aprendizaje profundo
vzn
3
Este aborda lo que parece ser el aspecto principal de la pregunta: ¿cuál es el punto de tener una supercomputadora de un tamaño particular si siempre va a ejecutar múltiples proyectos simultáneamente? ¿Cuál es el punto de tener una computadora con capacidad C si las personas solo necesitan capacidad C / 2 y es presumiblemente más barato construir dos computadoras más pequeñas que una grande?
David Richerby