La duración de la copia de 1,5 TB de datos depende en gran medida del tipo de datos. Si tiene unos 1,500 archivos de 1GB, probablemente solo tomará unas pocas horas, pero si tiene mil millones y medio de archivos de 1KB, probablemente tomará días.
Esto se debe a dos especificaciones rivales en los discos: el rendimiento y el tiempo de acceso promedio. Un disco tradicional con un rendimiento de 100 MB / seg y un tiempo de acceso de 10 ms es bastante común. Si puede transmitir datos secuencialmente, puede obtener 100 MB / seg. Sin embargo, si necesita saltar a otro lugar, le llevará 10 ms. Si hubiera estado transmitiendo, podría haber escrito 1 MB de datos en el tiempo que lleva saltar a otra ubicación.
Crear un archivo puede tomar varias búsquedas, por lo que crear un archivo de 1 KB puede "costar" tanto como transmitir varios MB de datos.
Por lo tanto, en algunos casos es mejor hacer una copia de disco sin formato del dispositivo de bloque que copiar en el sistema de archivos a través de algo como rsync. Si tiene muchos archivos, en un sistema de archivos que, por ejemplo, está lleno al 50% o más, a menudo es mejor que simplemente copie el dispositivo de bloque completo a través de "dd", en la medida del tiempo que tome. Por supuesto, no puede hacer esto mientras el sistema de archivos está montado, por lo que también tiene inconvenientes.
Los SSD pueden ayudar a mitigar esto, porque sus tiempos de acceso son aproximadamente 100 veces más rápidos, pero los discos SSD MLC tienen problemas de acceso complicados dependiendo de la disponibilidad de un grupo de bloques previamente borrados. Los SSD SLC pueden ayudarlo.
Los controladores RAID con caché incorporada pueden ayudar con las búsquedas, al igual que algo como el módulo de kernel flashcache que le permite almacenar en caché un dispositivo de bloque a través de un SSD.
Los sistemas RAID pueden permitir múltiples búsquedas paralelas, reduciendo efectivamente el tiempo de acceso promedio y también la paralelización para aumentar el rendimiento. Pero su rendimiento general a menudo dependerá de cuántos archivos estén involucrados.