Pequeño grupo de computación distribuida

13

Soy un estudiante de secundaria que intenta construir un clúster de Linux para un proyecto (tengo un montón de computadoras decentes programadas para volver a crear imágenes este verano, por lo que el departamento de tecnología básicamente dice que mientras no las rompa físicamente puedo Haz lo que sea.

De todos modos, realmente no sé nada sobre la construcción de un clúster, pero soy bastante bueno con Linux.

Necesito saber estas cosas: -¿Qué distribución debo usar? ¿Incluso importa? -¿Qué software puede configurar el clúster? -En el tablero o FS distribuido? -¿Algunos sitios que pueden ofrecer guías decentes o instrucciones?

Gilles 'SO- deja de ser malvado'
fuente
¿Cuál sería el propósito del clúster?
Frederik Deweerdt
Los clústeres modernos se crean para un propósito específico. Por lo general, para aplicaciones web o almacenamiento de datos. Quizás puedas probar LVS .
David S.
Como otros han escrito, 'clúster' con frecuencia implica ejecución paralela, que requiere códigos especiales o programación. Un uso diferente pero genial de varias computadoras que trabajan juntas es la conmutación por error en vivo de los sistemas de archivos reflejados. Tómese un minuto y observe DRBD y los sistemas de archivos agrupados. Esto también puede darle ideas: xenamo.sourceforge.net
pboin

Respuestas:

6

Realmente depende de lo que está tratando de lograr y de lo que quiere decir con "Cluster de Computación Distribuida". Hice algo similar una vez en Uni usando máquinas viejas y PVM que es el "Clúster" en el sentido de un montón de máquinas que actúan como una sola computadora para hacer un procesamiento paralelo: piense en los clústeres de Beowulf. Por supuesto, necesitará un código escrito para aprovechar esto.

Un buen lugar para comenzar sería determinar lo que está buscando aprender con este proyecto. Recomiendo leer el artículo de Wikipedia sobre computación paralela para empezar, y luego refinar sus necesidades en función de lo que desea hacer.

Un simple sistema de colas de trabajo (como Gearman ) puede ser suficiente para obtener rápidamente resultados geniales.

El problema que tuve cuando hice un clúster de computación en paralelo, fue que no tenía nada que hacer en él, simplemente se quedó allí, pero fue un proyecto divertido y aprendí bastante. En cualquier caso, es probable que aprenda un poco y se divierta al mismo tiempo, independientemente de lo que elija implementar.

En cuanto a la elección de distribuciones, iría con lo que me resultaba más cómodo, ya que es probable que necesite instalar cosas desde la fuente. Una vez que se sienta cómodo con la configuración de todo, puede buscar una distribución que se adapte más a sus necesidades. Pero cualquier distribución debe hacer.

¿Qué software configurar el clúster? Esto depende completamente de qué tipo de clúster cree.

¿A bordo versus FS distribuido? Nuevamente, esto depende de cuáles son los requisitos para su clúster. ¿Cada nodo pasará datos de un lado a otro entre los otros nodos? ¿Operarán como esclavos con un solo amo? ¿operarán de manera completamente independiente? Estas preguntas comenzarán a informar sus elecciones. Y, por supuesto, siempre hay compensaciones.

Algunos otros enlaces que pueden resultar interesantes:

http://hadoop.apache.org/

http://www.csm.ornl.gov/oscar/

https://computing.llnl.gov/tutorials/parallel_comp/

http://www.google.com/Top/Computers/Parallel_Computing/Programming/Environments/

http://www.google.com/Top/Computers/Parallel_Computing/Beowulf/

gabe
fuente
-1

Pruebe Linux HA (alta disponibilidad), es una solución de clúster de Linux disponible gratuitamente que funciona en varias distribuciones.

Probablemente sea solo una de varias soluciones. No sé cómo se compara con los demás, ni siquiera cuáles son sus características específicas, solo sé que algunos compañeros de trabajo juraron por un software comercial serio.

asoundmove
fuente