Tengo algunos archivos grandes que necesito copiar de una máquina Linux a otras 20 máquinas Linux, todo en la misma LAN tan rápido como sea posible. Qué herramientas / métodos serían los mejores para copiar estos archivos, teniendo en cuenta que esta no será una copia única. Estas máquinas nunca estarán conectadas a Internet, y la seguridad no es un problema.
Actualizar:
La razón por la que pregunto esto es porque (según tengo entendido) actualmente estamos usando scp
en serie para copiar los archivos en cada una de las máquinas y me han informado que esto es "demasiado lento" y se está buscando una alternativa más rápida. De acuerdo con lo que me han dicho, intentar paralelizar las scp
llamadas simplemente lo ralentiza aún más debido a las búsquedas del disco duro.
fuente
Respuestas:
BitTorrent. Es cómo Twitter implementa algunas cosas internamente.
http://engineering.twitter.com/2010/07/murder-fast-datacenter-code-deploys.html (enlace a archivo web)
fuente
¿Qué hay de UFTP? Utiliza multidifusión para entregar archivos a través de UDP a múltiples clientes a la vez. No es para todos y no soy un experto en eso, pero parece que hace lo que quieres.
fuente
¿Has intentado copiar estos datos
rsync
? Si tiene una LAN de 1 Gbit o más rápido, copiar más de 4 * 20 GB no debería ser un problema.¿Con qué frecuencia ocurrirá esta copia? ¿Importa si tarda un par de minutos en terminar?
fuente
scp-tsunami es el camino!
https://code.google.com/p/scp-tsunami/
Se usa comúnmente para distribuir imágenes de disco en clústeres de virtualización, sus rendimientos son casi bittorrent pero es más simple de usar para el uso diario.
fuente
Configurar un recurso compartido NFS y hacer que cada máquina extraiga de este repositorio compartido de archivos grandes probablemente sea el método más rápido (NFS es muy rápido y tiene poca sobrecarga).
Puede agregar una NIC o dos adicionales al servidor de origen y unirlas para obtener un mejor rendimiento.
La implementación podría ser un simple trabajo cron en cada servidor de destino que extrae ciegamente del recurso compartido cada hora / día / lo que sea. También puede configurar un demonio para sondear nuevos archivos; también puede simplemente guiar una sesión de control a SSH (con pares de claves) en cada cuadro de destino e indicarles que busquen el archivo cuando ejecuten su guión.
fuente