¿Debo ejecutar una verificación en las copias de seguridad de cinta LTO aunque las unidades mismas realicen la verificación mientras escriben?

8

Tenemos una unidad de cinta LTO-3 en una biblioteca de medios de Dell que utilizamos para nuestras copias de seguridad en cinta. El artículo sobre LTO en Wikipedia establece que:

LTO utiliza una tecnología automática de verificación después de la escritura para verificar inmediatamente los datos a medida que se escriben, pero algunos sistemas de respaldo realizan explícitamente una operación de lectura de cinta completamente separada para verificar que la cinta se haya escrito correctamente. Esta operación de verificación separada duplica el número de pasadas de extremo a extremo para cada copia de seguridad programada y reduce la vida útil de la cinta a la mitad.

Lo que me gustaría saber es: ¿necesito mi software de respaldo (Backup Exec en este caso) para realizar una verificación en estas cintas o es suficiente la tecnología de verificación después de la escritura inherente a las unidades LTO?

También me gustaría saber si Backup Exec entiende la tecnología de verificar después de escribir lo suficiente como para alertarme si esa tecnología no puede verificar la información o simplemente la ignorará y la volverá inútil de todos modos, ya que incluso si la unidad detecta un problema, nunca lo haría. saber sobre esto.

Chris Magnuson
fuente

Respuestas:

10

Gran pregunta!

Si bien diría que sí, debe probarlos, diría que probar las cintas / unidades en sí mismos es importante, lo que es mucho más vital es probar el proceso de restauración de extremo a extremo .

No puedo recomendar suficientes restauraciones regulares del sistema completo y pruebas de servicio, es la única forma de saber con certeza que todo el sistema está haciendo lo que usted compró. No tiene que buscar mucho en este sitio para ver personas que luchan por restaurar su servicio a pesar de que pensaron que habían cubierto todos los pasos individualmente.

Espero que esto ayude.

Chopper3
fuente
1
+1 para restaurar. Es en este punto que intervino con "máquinas virtuales". - la restauración en una máquina virtual puede ser un buen indicador no disruptivo de que su copia de seguridad es útil
Sirex
1
Lo que dice definitivamente es una buena idea y deberíamos comenzar a hacerlo, pero todavía no estoy seguro de si la tecnología de verificación en escritura en las unidades LTO 3 hará que mi copia de seguridad falle si, por algún motivo, los datos no pueden verificarse como lo haría ocurrirá si mi software de respaldo ejecutó una verificación en los datos. Me gusta la idea de hacer algo más, pero aún necesito saber si estoy haciendo algo redundante que no es necesario. Gracias
Chris Magnuson
1
También asegúrese de realizar una restauración utilizando una unidad de cinta diferente a la que se realizó la copia de seguridad, ya que algunas cintas solo se pueden leer en la unidad que las realizó (o al menos esto fue posible en el pasado).
James
@ChrisMagnuson ¿Alguna vez descubrió qué sucede si la unidad detecta un error utilizando su propio esquema de verificación después de la escritura?
alx9r
1
@ alx9r me temo que no. Parece que nadie lo sabe con certeza y no estoy seguro de cómo puede desordenar intencionalmente los datos inmediatamente después de que fueron escritos por el cabezal de la cinta, pero antes de que sean leídos por cualquier mecanismo que realice la verificación después de la escritura para que pueda ver cómo responde su software de respaldo al detectar un error.
Chris Magnuson
1

En primer lugar, esta verificación automática no sustituye a la verificación de extremo a extremo. He visto unidades enviadas con un error de firmware que causó que la lectura de restauración sea menos confiable que la lectura de verificación.

El resultado de eso fue que podía escribir las cintas sin que se informara ningún error, pero al tratar de restaurar, vería que las lecturas obtenían errores o bajaban la velocidad en varios órdenes de magnitud.

La mayoría de los clientes nunca notaron este error de firmware. Según el vendedor, porque los clientes en realidad no realizaron restauraciones de prueba. Este error en particular se solucionó. Pero estoy seguro de que no hemos visto el último error de firmware, y algunos errores de firmware solo se descubrirán si realmente prueba lecturas reales.

Lo que sucede cuando falla la verificación es que el firmware escribe automáticamente una segunda copia (y durante la restauración del firmware de forma transparente al host solo se devuelve una de las dos copias). Esto significa que la capacidad disponible varía según el estado del disco y la calidad de los medios.

Si demasiados intentos de escritura fallan en la lectura de verificación, se informa un error a nivel SCSI. Uno podría pensar que un error reportado de esta manera es difícil de pasar por alto en la capa de software, pero los errores en las rutas de código que solo se activan con hardware escaso son notoriamente difíciles de probar.

kasperd
fuente