Error de copia de seguridad de Windows Server: ¿no se pueden proteger los volúmenes superiores a 16,7 TB?

10

Estoy tratando de usar Windows Server Backup para hacer una copia de seguridad de una matriz RAID en mi nuevo servidor. Pero, cuando lo hago, me encuentro con este error:

ingrese la descripción de la imagen aquí

El servidor ejecuta Windows Server 2012 R2 y la matriz en cuestión tiene un tamaño de 20 TB (con 18 TB utilizables); Actualmente se está utilizando menos de 1 TB.

Sé que en Windows Server 2008, no se podían hacer copias de seguridad de volúmenes superiores a 2 TB debido a una limitación en VHD, pero que Microsoft ahora ha cambiado a VHDX, que permite realizar copias de seguridad de volúmenes de 64 TB. También soy consciente de que para aprovechar esto, la unidad en cuestión debe ser GPT.

He confirmado que mi disco es, de hecho, GPT.

ingrese la descripción de la imagen aquí

Cuando ejecuto Windows Server Backup, estoy usando la opción "Backup Once" y haciendo una copia de seguridad en una unidad de red. También estoy usando lo que creo que son configuraciones estándar. Pero, cuando intento ejecutar la copia de seguridad, me aparece el error visto anteriormente.

No estoy seguro de por qué esto tiene un límite de 16.7 TB, ya que Windows Server Backup puede respaldar volúmenes de hasta 64 TB. ¿Alguien puede darme una idea de por qué esto puede estar sucediendo o qué podría estar haciendo mal?

Actualización: recibí nuevas unidades y creé la matriz nuevamente, pero sigo recibiendo el mismo error. Puedo confirmar que mi recuento de clústeres es inferior a 2 ^ 32.

ingrese la descripción de la imagen aquí

Leí en esta pregunta que aparentemente la copia de seguridad de Windows no admite la copia de seguridad desde o hacia discos que no tienen sectores de 512 o 512e bytes. Mirando el recurso compartido de archivos al que estoy intentando hacer una copia de seguridad, utiliza 4k sectores. ¿Podría ser este el problema subyacente? Si ayuda, el recurso compartido al que estoy intentando hacer una copia de seguridad se aloja en un servidor CentOS.

Chris Powell
fuente
Es un mensaje 'protegido', no un mensaje de espacio, per se. La 'configuración estándar' para una copia de seguridad del servidor de Windows es utilizar DPM - Administrador de protección de datos. Parece que hay una limitación de software cuando se usa DPM. Es posible que desee ver si la configuración permitirá que se realice una copia byte por byte, sin la llamada 'protección' habilitada, suponiendo que tenga una manera de restaurar una copia byte por byte si es necesario.
Andrew S
1
@ Andrew No, ese es un mensaje de Windows Server Backup. "Protegido" parece ser la nueva palabra de moda en las copias de seguridad en estos días. Incluso mi tablero de Avamar (producto de respaldo d2d empresarial) me dice que tiene X TB de datos "protegidos" para nosotros.
HopelessN00b
2
Es un mal uso desafortunado de la palabra 'respaldo'. Los dioses ITIL se están enojando, sin duda. Pero, como resulta que el límite de TAMAÑO DE ARCHIVO en NTFS es 16.7TB, ese es el problema: la copia de seguridad (supongo) es un archivo gigante y 16.7TB es el límite para ese tamaño. Microsoft y los otros proveedores pueden destrozarlo y llamarlo una 'protección' o cualquier otra babosa de marketing idiota que quieran, todavía lo llamaré una 'copia de seguridad'.
Andrew S
@ Andrew Se usa como una medida del tamaño de datos original, antes de la deduplicación de datos y las instantáneas y demás. Y el límite de tamaño de archivo para NTFS en Server 2012 es 256TiB, no 16 TiB .
HopelessN00b
FWIW: mismo problema aquí. Servidor 2016, unidades de 20 y 63 TB, 16 KB de bytes por clúster en el volumen, bajo 2 ^ 32 clústeres por volumen, disco físico de 512 bytes, sectores y GPT. Las sombras vss funcionan sin problemas, las copias de seguridad obtienen el mismo error que usted. Estoy a punto de rendirme y escribir un maldito script de PowerShell que toma una instantánea y ejecuta un script predeterminado por carpeta, y para archivos en la raíz, lo que será mucho más difícil de manejar ...
Cookie Monster

Respuestas:

8

De acuerdo, la razón por la que falla la copia de seguridad de Windows Server es por el tamaño del clúster que está utilizando en el volumen. (Y explicaré exactamente por qué eso es al final, después de que el problema importante de su matriz RAID sea una bomba de tiempo).

Pero antes de abordar el problema de la copia de seguridad, debemos abordar el problema con su configuración RAID.

No use RAID5 con discos grandes. Y no use RAID5 con matrices con muchos miembros. Con solo un disco de paridad, es casi seguro que se encontrará con un URE (error de lectura irrecuperable) u otra falla de disco con tantos discos grandes, por lo que no tiene redundancia real. Si tiene que usar RAID de paridad, use RAID6, pero aun así, RAID de paridad viene con serios inconvenientes, así que piense mucho antes de decidirse por RAID de paridad.

Recomendaría romper esa matriz de 20 TB y volver a crearla en RAID 10. Obtendrá un rendimiento mucho mejor y una redundancia real para sus datos. Como solo está usando 1 TB de todos modos, todavía le quedan 9 TB para el crecimiento futuro y, francamente, si logra eso, debe buscar un dispositivo NAS dedicado o un servidor de almacenamiento.

Una vez que obtenga su matriz RAID en un estado razonable, también resolverá este problema, ya que será más pequeño que los 16 TiB de los que se queja actualmente. Pero, si quieres saber, no es el tamaño de la matriz con la que tiene un problema, es la cantidad de clústeres. Debe tener menos de 2 ^ 32 clústeres en el volumen que está respaldando. Cambie el tamaño de su clúster de 4 KB a 8 KB y debería estar listo.

Para verificar el tamaño de su clúster, use:

fsutil fsinfo ntfsinfo F:

Y debería obtener algo como el clip de pantalla a continuación.

ingrese la descripción de la imagen aquí

Si tiene curiosidad de dónde proviene ese número de 16TiB, esta publicación de blog de msdn debería aclararlo para usted .

HopelessN00b
fuente
Gracias por su preocupación sobre RAID. Traté de convencer a mi jefe de que me permitiera usar RAID6, pero no tuve éxito. En realidad, está en una matriz de discos de 5 TB, no en discos de 2 TB (perdón por eso, debería haber especificado). La razón por la que se utilizan tan pocos datos es porque aún no los hemos puesto en producción. Pero, eventualmente será nuestro nuevo NAS. Y también realizamos copias de seguridad muy a menudo para que podamos recuperarnos fácilmente de una matriz degradada. Entonces, ¿eso significa que si recreara la matriz con un tamaño de franja más grande no tendría este problema?
Chris Powell
1
@ChrisPowell Lo siento, hablé mal (mal escrito). Quise decir cluster, no stripe. Necesita reformatear la matriz, excepto que esta vez, seleccione 8 KB (o más, si lo desea) para el tamaño de su clúster.
HopelessN00b
2
@ChrisPowell Gracias por hacer el esfuerzo de hacer una buena pregunta ... y una que podría responder también, bono. :)
HopelessN00b
1
Solo una actualización; te alegrará saber que volví a hablar con mi jefe y lo convencí de que me dejara cambiar el NAS a RAID6 y actualizar las unidades a 6TB. Gracias de nuevo por tu ayuda.
Chris Powell
Otra actualización: acabo de recibir las unidades, configuré la matriz y la formateé con un tamaño de clúster de 8 KB y todavía recibo este error. ¿Algún consejo? Revisé mis grupos totales y está muy por debajo de 2 ^ 32.
Chris Powell
0

16,7 TB es el límite de tamaño de archivo para el sistema de archivos NTFS. El límite de tamaño de archivo de NTFS5 es de 16 exabytes. Como se trata de una unidad de almacenamiento compartida, es posible que tenga formato NTFS, no NTFS5. Tendrá que verificar. Todos los inconvenientes que obtengo son personas que suponen que está escribiendo en un sistema de archivos NTFS5.

Andrew S
fuente
Menos todo lo que quieras - esta respuesta es correcta
Andrew S
1
WSB no escribirá un archivo de 16 TiB para ~ 1 TiB de datos para respaldar, por lo que no es eso. La fuente real del problema es el límite de implementación NTFS de 2 ^ 32 -1 clústeres, combinado con un tamaño de clúster de 4KB , que ha sido el predeterminado por mucho tiempo.
HopelessN00b