Almacenamiento a largo plazo de datos críticos de negocios

16

Este es realmente complicado, y hasta cierto punto no es un problema técnico, y puede que no pertenezca aquí, pero

Server Fault es para administradores de sistemas ... que administran o mantienen computadoras en una capacidad profesional

Y lo hago ... y esta es una de mis tareas ... De todos modos.

Imagine que tiene más de 5000 páginas a doble cara de A4. Datos de la empresa, todos los negocios críticos.
Necesitas hacer una copia de seguridad, de alguna manera. Las soluciones propuestas hasta ahora son:

  1. PDF -> Almacenamiento en línea
  2. PDF -> DVD / BluRay / Cinta
  3. PDF -> Unidad de disco duro / SSD / Flash portátil.
  4. Compre / Alquile / Alquile / 'Robe' una gran fotocopiadora y haga copias.
  5. ???

Problemas inmediatos con lo anterior:

  1. ¿Qué pasa si el socio de almacenamiento se quiebra?
  2. Los DVD se pudren con el tiempo. Cintas de manera similar.
  3. Estos también se rompen con el tiempo.
  4. Costoso. Lento. Pesado. No es amigable con los árboles.

Las preguntas):

¿Cuál es el estándar de oro para la preservación y el archivo de datos a largo y mediano plazo? ¿Has resuelto un problema similar en el lugar de trabajo?

Después de la carga inicial, es necesario agregar a la colección aproximadamente 100 páginas al mes. La recuperación debería ser posible, fácilmente, pero probablemente es poco frecuente.
Idealmente, me gustaría garantizar que la solución sea viable mucho después de haber dejado la empresa, y que no requerirá una cantidad masiva para mantenerla en mantenimiento, por lo que almacenar muchos DVD no solo no es ideal, sino que tampoco Una buena solución a largo plazo.

Si bien hacer copias en papel es sin duda lo más fácil, no es lo más ecológico, ni mucho menos. Tampoco es muy manejable, difícil de buscar, indexar, etc. Combinado con pesado y difícil de almacenar físicamente.

En principio, me gusta la idea de tener todo almacenado electrónicamente, pero el mecanismo real para hacerlo debe ser transparente y fácil. Realmente no quiero ser responsable de esto para siempre y para un día, apoyar a los usuarios de la oficina mientras lo arruinan y pierden documentos. Tampoco quiero depender de un único proveedor de almacenamiento, ¿qué pasaría si Dropbox (tenemos un cajero automático con solución de respaldo en línea, pero no es Dropbox) se declarara en quiebra o experimentara un evento catastrófico, cuántas empresas ¿Quién está utilizando sus servicios estaría en el arroyo, sin remo?

Aquí hay cierta flexibilidad presupuestaria, pero sospecho que cualquier cosa que cueste más que nuestra copia de seguridad en línea actual (que es como 2500USD / año), se vería menos favorablemente, en comparación con solo ponerlo en una caja de zapatos debajo de la cama. Lo cual es sin duda lo que sucedería si no hiciera nada y renunciara mañana.

¿Algunas ideas?

-Editar-

La razón para hacer esto es doble.

1) proporcione una copia de seguridad segura y sensata de la documentación crítica del negocio en caso de que la oficina se queme.

2) para cumplir con las leyes de archivo de datos WRT uk law law para empresas, etc.

Edición 2:

Tener algún mecanismo para indexar los documentos también sería muy útil.

Tom O'Connor
fuente
Abrí un script rápido para hacer PDF-> Txt con ghostscript y gocr. Ociosamente considerando arrojar todo a una base de datos SQLlite para crear un índice interesante para los datos.
Tom O'Connor
La redundancia (de los medios digitales) y el mantenimiento de la redundancia a lo largo de los años pueden ser su mejor amigo.
Vortico

Respuestas:

5

Mantener los datos en un formato como PDF es probablemente seguro, porque hay herramientas gratuitas para leerlos. El volumen de datos del que habla es bastante pequeño (1.200 páginas / año), por lo que incluso con una resolución de escaneo de 300 ppp, solo habla de decenas de gigabytes por año.

Sin embargo, el problema del dispositivo de almacenamiento físico nunca desaparecerá. Cualquier medio que use para almacenar datos electrónicos (cinta, óptica, etc.) eventualmente necesitará actualizarse a un medio más nuevo. Planifique y haga un presupuesto para "lanzar los datos en el camino" a nuevos formatos a medida que los nuevos formatos reemplacen a los antiguos.

Probablemente miraría a los medios ópticos como primera opción simplemente porque tienes muy pocos datos. También planeo grabar 3x duplicados de todo y actualizar los medios cada 2 o 3 años.

Si el medio óptico es demasiado pequeño, usaría cinta LTO y actualizaría el medio cada 4 a 5 años. Sin embargo, será bastante costoso para una cantidad de datos tan pequeña.

Evan Anderson
fuente
¿DVD? O Blu-ray? ¿BR es un formato sensible para los datos todavía?
Tom O'Connor
1
@ Tom O'Connor: A mí me parecen lo mismo. Vería el costo para tomar esa decisión. Ahora hay espacios en blanco de Blu-Ray de "grado de archivo", por lo que desde una perspectiva técnica parece un formato viable. (Los fabricantes que dicen que los medios Blu-Ray tienen una vida "clasificada" de 200 años no me dan más confianza que aquellos que dijeron que los medios de archivo DVD tenían una vida "clasificada" de 100 años ...)
Evan Anderson
Tengo algunos CD-R Kodak GOLD de alrededor de 1998, más o menos, y todavía son legibles. También tengo algunos gratuitos, donde la capa de tinte se ha separado y están atornillados.
Tom O'Connor
No estoy sugiriendo que no haya una diferencia en los medios de archivo frente a los que no son de archivo. Simplemente digo que los medios con calidad de archivo Blu-Ray versus los medios con calidad de archivo DVD no me parecen muy diferentes. Comparar el grado de archivo versus el "huso de 100 por $ 20.00" es una historia completamente diferente.
Evan Anderson
Un elemento no mencionado fue el almacenamiento de estado sólido (unidades de memoria USB): más grande que óptico, más pequeño que LTO. Es probable que el USB tenga una duración de al menos otra década o dos, y una memoria USB de 16 GB o 32 GB (o dos, o tres) es bastante barata en términos de costo de archivo. Dado que va a escribir una vez, leer muchas, no tiene que preocuparse por el desgaste de las células SSD, por lo que, en teoría, podría mantener palos durante 5 o más años en una bóveda a prueba de fuego.
voretaq7
6

Existen sistemas específicos que utilizan DVD internamente y migran los datos a nuevos medios de vez en cuando. Busque la preservación digital.

Dado que los requisitos de almacenamiento aumentan bastante rápido, de todos modos es recomendable cambiar a un tipo de medio más nuevo y más grande cada pocos años.

Suponiendo que obtenga los datos en papel, debe:

  1. Liste los datos en la entrada de correo. Esto puede significar dar a cada hoja un código de barras único.
  2. Escanealo. Use el identificador de código de barras como nombre de archivo. Archivar el papel.
  3. Archivar los datos. Ponga los datos en un sistema de archivo seguro de revisión. Un servidor de archivos no será lo suficientemente bueno porque podría pasarle algo a los archivos si son accesibles para escritura.
  4. Que sea de lectura accesible para otros sistemas.

En el caso de los clientes, todas las facturas para grandes organizaciones deben transferirse al sistema en línea (SAP). El almacenamiento de archivos pasó por varias iteraciones por ahora. Actualmente se están mudando a Blue Ray.

Por otro lado, hoy en día todo va a los discos, por lo que tal vez algo en este sentido sería su camino a seguir: http://www.eurostor.com/german/iTernity.D.php

Posipiet
fuente
Tenga en cuenta que la mayoría de los DVD-R (et al) solo duran unos años antes de degradarse. Los costosos "archivos" duran más si se guardan de acuerdo con las instrucciones.
Chris S
Lo mismo ocurre con la mayoría de los discos, servidores, sistemas de archivos o formatos de documentos. Archivar significa mover los datos. Intenta leer un pdf en 20 años. ¿Recuerdas cuál era el estándar hace 10 años? No tenemos nada parecido al papel, de verdad. Excepto copiar y pegar ...
Posipiet
Los documentos de texto puro son bastante legibles aún.
Bart Silverstrim
Hay herramientas gratuitas para leer archivos PDF. Mientras sean "vainilla", no estaría demasiado preocupado. TIFF también es una buena opción.
Evan Anderson
3

Nuestra solución: Escanear a PDF -> Copia de seguridad en cinta

Tenemos un escáner de documentos, hace ~ 30 páginas / min y produce archivos PDF OCR. Los respaldamos a Tape (específicamente LTO4) que tiene una vida útil de 50 a 100 años (encontrar una unidad de cinta puede ser difícil en el marco de tiempo, pero hay lugares de recuperación de datos que aún recuperarán discos flexibles de 8 ").

Chris S
fuente
2
Tuve que google 8 "disquete ....
Holocryptic
Conservo mis cintas de copia de seguridad de Mac OS 7.5. Pero el disco se rompió, los medios de los programas de respaldo se perdieron. Logré reinstalar la Mac, pero no puedo leer la cinta porque no tengo el programa de respaldo. Y, francamente, ni siquiera recuerdo su nombre. Sí, la cinta puede durar 100 años. Pero el lector no.
Posipiet
@Holocryptic: Hace solo unos meses arrojé una caja sin abrir de disquetes de 8 "con sector duro de Verbatim.
user9517
1
@Holocryptic: NSFW! NSFW !!
Bart Silverstrim
@Posipiet, creo que cubrí el hecho de que las unidades no duran para siempre, pero hay empresas que se especializan en recuperar datos de casi cualquier medio de uso común.
Chris S
3

Creo que el nuevo servicio Glacier de Amazon es una oferta interesante en este espacio.

Amazon Glacier está optimizado para datos a los que se accede con poca frecuencia y para los cuales son adecuados tiempos de recuperación de varias horas. Con Amazon Glacier, los clientes pueden almacenar de manera confiable grandes o pequeñas cantidades de datos por tan solo $ 0.01 por gigabyte por mes, un ahorro significativo en comparación con las soluciones locales.

ewwhite
fuente
2
Los costos de recuperación son increíblemente inmensos.
Tom O'Connor
2

Paso uno, Copia de seguridad: OCR los documentos, y luego reorganice todas las palabras en una serie de novelas sobre la Iglesia Católica, el Opus Dei y los Templarios. Debe tener suficientes datos de entrada para aproximadamente 10 novelas, y aproximadamente una más cada año más o menos para siempre. Mantenga una tabla de búsqueda que contenga las palabras ubicación original en los documentos de origen (en orden de origen), y su ubicación final en las novelas; almacenar palabras duplicadas en una entrada en la tabla. Asegure un acuerdo de publicación y publique millones de novelas. Utilice los ingresos de las ventas de libros para financiar la operación de reordenamiento de palabras y OCR. Triture los documentos originales y véndalos como ropa de cama de hámster. En ocasiones, puede ser necesario realizar pedidos de compra de crucifijos, antimateria o boletos de avión a lugares exóticos, si encuentra que le faltan vocabulario en sus documentos de entrada.

Paso dos, Recuperación / acceso: no es necesario almacenar copias de los datos; todo lo que necesita es su tabla de búsqueda y una librería de segunda mano.

Como la tabla de búsqueda es su único punto de falla, aún tendrá que respaldar esto. Gracias al esquema de codificación de huffman empleado, este será bastante pequeño, en comparación con sus documentos de entrada, por lo que probablemente podría copiarse a DVD. Para realizar copias de seguridad fuera del sitio, siéntese frente a un fuego de leña y lea la tabla de búsqueda, mientras se graba en video. Coloque su pieza de rendimiento de video en la fusión de arte y tecnología en la Galería Tate Modern, en exhibición permanente.

Duncan Lock
fuente
1

Es demasiado pronto para comprarlo, pero parece que HDS ha creado un mecanismo de almacenamiento de datos permanente basado en cuarzo: lea .

Chopper3
fuente
1
He escuchado el reclamo de permanencia tantas veces que nunca voy a creerlo y ninguno de nosotros vivirá lo suficiente como para verlo probado. Las predicciones de permanencia son absolutamente inútiles e invariablemente se prueban equivocadas.
John Gardeniers
-2

Tengo que presentar Humyo.com (comprado por Trend Micro, cuyo segundo nombre es seguridad)

Cifran todos los datos del usuario y sus servidores están alojados en el Banco de Inglaterra en una bóveda.

Bastante seguro :)

benhowdle89
fuente
1
Apuesto a que en realidad no están en el Banco de Inglaterra. No hay espacio allí, está lleno de banqueros.
Tom O'Connor
55
Trend Micro, cuyo segundo nombre es bloatware ...
Tom O'Connor
Estoy de acuerdo con usted en Trend Micro pero solo lo poseen, usted opera con el software de
Humyo