¿Cómo manejas el archivo de datos? [cerrado]

9

Las copias de seguridad son una cosa, pero el archivo a largo plazo es otra. Por ejemplo, es posible que deba almacenar correos electrónicos durante 7 años o conservar todos los datos del proyecto indefinidamente. Solía ​​guardar archivos en cinta, pero luego me destruyeron cintas (las unidades arrancan la cinta). Entonces ... escribe en 2 cintas que te escucho decir. ¿Es eso lo que hacen los demás? ¿Tiene 2 (o más) cintas de los mismos datos para redundancia?

Pero el otro problema es que las cintas no pueden ser leídas por diferentes proveedores de software de respaldo. Por ejemplo, si pasa de Arcserve -> Backup Exec -> Commvault durante 10 años, necesitaría conservar los 3 sistemas para poder restaurar los datos antiguos. Asimismo para hardware. Es posible que las cintas viejas no tengan código de barras. Es posible que no sea compatible con la nueva biblioteca, etc., etc. ¿Mantiene el hardware de cinta y el software antiguos en caso de que necesite restaurar un archivo de 10 años?

O ... cuando se muda a un nuevo sistema de respaldo, ¿migra todos los datos archivados al nuevo sistema y lo vuelve a archivar en nuevas cintas? Eso podría ser un gran trabajo.

¿Alguna idea?

PowerApp101
fuente
¿Cuántos datos estás buscando archivar?
GreenKiwi

Respuestas:

3

¿De cuántos datos estamos hablando? Nuestros datos de "archivo" son lo suficientemente pequeños como para guardarlos en el almacenamiento en vivo (en una unidad NAS) que se respalda con los datos en vivo habituales, por lo que existe tal como lo hacen nuestros datos habituales y está sujeto a las mismas técnicas de recuperación sin tener que preocuparse por mantener la tecnología de hace una década. Si nuestros datos en vivo se mueven a una nueva plataforma de almacenamiento, el archivo se mueve junto con él. También establecemos los permisos para los datos de archivo de modo que solo un miembro del grupo de seguridad de archivo (del cual hay muy pocos usuarios miembros) tenga acceso para eliminar cualquier cosa de esas carpetas.

Si está tratando con más datos de los que se pueden guardar razonablemente en el almacenamiento en vivo, la cinta puede ser su mejor opción para el almacenamiento a largo plazo, junto con mantener al menos dos copias en diferentes ubicaciones de almacenamiento controlado. Explíquelos cada dos años para asegurarse de que los medios siguen siendo legibles y migre de los medios más antiguos a los nuevos si está cambiando de proveedor para asegurarse de que pueda continuar accediendo a los datos.

Justin Scott
fuente
1
Los archivos son de aproximadamente 3 o 4 TB. Esto es demasiado para hacer una copia de seguridad como parte de la copia de seguridad regular, requeriría muchas cintas adicionales cada semana, lo cual es un desperdicio ya que nunca cambia. Y no tenemos almacenamiento SAN adicional de todos modos.
PowerApp101
1
Para 3-4TB, recogería un montón de unidades externas de 1.0-1.5TB y haría dos juegos de copias de seguridad directamente en las unidades. Seagate crea un gabinete que tendrá 4 unidades SATA de 1 TB y permitirá el acceso a través de una única conexión USB. Puede cargar dos de esos y colocarlos en diferentes lugares. Todavía los saca cada año o dos para asegurarse de que todavía funcionan y reemplaza las unidades según sea necesario. Dependiendo de su proveedor, las cintas pueden ser menos costosas.
Justin Scott
Sí, supongo que es una solución plausible en estos días de disco barato. Me encantaría alejarme de la cinta, es demasiado poco confiable (errores de CRC, cinta rota, errores de etiqueta, etc.).
PowerApp101
Sí, iría con esta opción. El espacio en disco es tan barato en estos días, que mantener los datos en vivo en un sistema redundante es el camino a seguir.
GreenKiwi
1
Una copia de seguridad de 4TB sobre usb tardaría casi 20 horas en completarse. ¿No tiene una ventana para completar el trabajo o, como usted dijo, sus datos nunca cambian? Si tienes una ventana, elegiría algo con una velocidad de datos más alta.
JohnyD
3

En mi caso, hacemos archivos en cinta y te diré por qué tiene sentido para nosotros.

En primer lugar, el software que utilizamos, Tivoli Storage Manager, es sin dudas, el software que utilizaremos en el futuro previsible. En mi opinión, TSM es la parte superior de la cadena alimentaria en términos de software de respaldo empresarial, por lo que el problema de cambiar a una plataforma de software diferente es relativamente inexistente para nosotros.

Dicho esto, mantenemos bastantes archivos a largo plazo, y tenemos algunas formas diferentes de hacerlo. Afortunadamente para nosotros, utilizamos algunas de las últimas tecnologías de cinta que pueden almacenar más de 1 TB por cartucho, por lo que tener una gran cantidad de archivos en vivo dentro de la biblioteca no es un problema.

  • Archive en cintas locales y copie esos archivos en nuestro centro de datos alternativo, con las cintas de archivo ubicadas dentro de la biblioteca de cintas.

Hacemos esto para ciertos tipos de datos porque los datos se restauran de forma regular y son lo suficientemente importantes como para requerir dos copias.

  • Archivar en cintas locales, pero no en cintas remotas, y dejar las cintas dentro de la biblioteca.

Hacemos esto para datos ligeramente menos importantes, que deben restaurarse de forma regular.

  • Archivar en cinta local y enviarlos fuera del sitio para su almacenamiento.

Las prácticas anteriores nos han funcionado bastante bien en el pasado. Migramos a una tecnología de cinta totalmente diferente hace un par de años, y fue un poco difícil mover los datos, pero realmente no fue un gran problema. En TSM, era literalmente un comando por servidor de archivos, y se ejecutaría. Podría llevar un par de días correr, pero no fue un esfuerzo de trabajo activo para nadie.

Sin embargo, la ola del futuro es obviamente un almacenamiento basado en disco.

Tan pronto como se presente la oportunidad, colocaré una matriz de discos en una instalación de almacenamiento segura y copiaré archivos de tipo auditoría a largo plazo en un dispositivo como ese.

WerkkreW
fuente
Buenas ideas. De hecho, tenemos una configuración similar. Tenemos 2 instalaciones remotas con bibliotecas de cintas. Usamos Commvault, similar a TSM, supongo. La cuestión es cómo define "datos ligeramente menos importantes". ¡Es importante para alguien! Y podría ser crítico para el negocio, sin que usted lo sepa.
PowerApp101
En la matriz de discos, vale la pena mirar ZFS en Solaris, o NetApp, que verifica regularmente sumas de verificación por bloque, reduciendo en gran medida la posibilidad de pudrición de bits. Cualquier enfoque de archivo que no tenga en cuenta la descomposición de bits me parece deficiente.
RichVel
0

También puede buscar una solución como Data Domain (ahora NetApp) . Archivan y realizan una compresión avanzada que llaman DeDupe, por lo que buscan datos similares y obtienen relaciones de compresión muy altas.

¿Qué tipo de datos está tratando de respaldar? ¿Son todos datos "aleatorios" como video o música? ¿O son datos que podrían prestarse a la compresión?

GreenKiwi
fuente
Sospecha que costaría demasiado, como Avamar. Utilizamos el software Commvault que también hace DeDupe si gasta los dólares, que no tenemos. ¡Maldita sea GFC!
PowerApp101
0

Avanza con la nueva solución de archivo y conserva las cintas durante el tiempo que necesites esos datos. Si lo requiere de forma permanente, puede considerar migrarlo al disco. Con las copias de seguridad del disco, la migración a medios futuros es decididamente más fácil.

Dentro de un año o quizás 2 a partir de ahora, puede comenzar a ignorar las cintas si esas copias de seguridad ya no son necesarias.

Reimplementar es un gran esfuerzo si el tiempo resuelve su problema por usted. Haga el análisis de costos si tiene un costo asociado con el almacenamiento de las copias de seguridad y / o las licencias de software para trabajar con ellas.

Martin Murphy
fuente
0

Su problema con el archivo de datos, para simplificar su enigma, parece ser la compatibilidad futura de cintas viejas con hardware nuevo.

Mi solución: elija un solo proveedor con una solución completa (software y hardware) en la que confíe hará todo lo posible para ofrecer compatibilidad heredada.

Y, obviamente, obtenga un contrato muy bueno en cuanto a precio teniendo en cuenta su fidelidad;)


fuente