¿Qué tipo de mantenimiento periódico debo realizar en la copia de seguridad de HDD?

15

Tengo un montón de directorios respaldados en un HDD externo, no un SSD, un disco magnético.

La copia de seguridad está solo en un solo disco (sí, lo sé, una HDD adicional con una copia sería una buena idea; pero ese no es el caso en este momento). Además, no hay copias duales de los archivos en el disco.

El HDD tiene (opción 1) mucho más espacio del que ocupan mis archivos (opción 2) menos espacio libre que el que ocupan mis archivos (pero sigue siendo una buena cantidad)

Mantengo el disco en su embalaje original: bolsa de plástico, dentro de un "cartón de huevos" como envoltorio, dentro de la caja de plástico. Se guarda en una habitación de mi casa con la caja nunca expuesta al sol, ni a la lluvia, etc.

Mi pregunta es: ¿Hay algo que deba hacer con el disco, periódicamente, para maximizar la longevidad de los datos? por ejemplo, leer todo en otro lugar, o leer y escribir de nuevo, o reorganizar las posiciones físicas de los datos en el disco de alguna manera, o incluso sacudir el disco, cambiar su posición física, encenderlo sin hacer nada, etc. etc. Me gustaría una respuesta para los dos escenarios opcionales que he descrito.

Notas:

  • Prefiero no hacer esta pregunta específica para una sola marca de HDD, pero si debe saberlo, es una unidad Toshiba STOR.E básica de 750 GB. No es mi elección, solo necesito trabajar con esto.
  • El manual del HDD no dice nada sobre este problema.
  • La copia de seguridad representa el estado de estas carpetas en algún momento del pasado. Suponga que es importante mantener este estado tal cual, y que no hay una "copia maestra" de los mismos datos.
  • Si bien es probable que sea irrelevante para la pregunta, no es catastróficamente malo si se pierden estos archivos, solo quiero aumentar la longevidad esperada.
  • incluso si tuviera dos copias, en dos HDD, la pregunta sería igual de relevante: ¿Qué tipo de operaciones de mantenimiento debo hacer en cada una de ellas por separado?
einpoklum
fuente
Una buena idea sería leer periódicamente los archivos para "mejorar" el campo magnético que representa los datos. El uso de un sistema de archivos que agrega un poco de automatización / protección adicional a esto lo haría un poco más fácil. Obviamente, sería preferible tener múltiples dispositivos de medios con los mismos datos. El manual no dice nada al respecto, ya que es un escenario poco común usar discos duros como almacenamiento fuera de línea (supongo).
Seth
44
Las respuestas parecen estar basadas en la opinión y la práctica común. No veo respuestas sólidas basadas en investigaciones o citas autorizadas.
Fixer1234
Preguntado y contestado, aquí en SU aunque es mucho más complicado que el P. leer la respuesta aceptada para este Q . ¡Todos los datos / fuentes / citas que podrías esperar! Puede extraer lo que funciona para usted de sus datos.
Gypsy Spellweaver

Respuestas:

5

Desde un punto de vista profesional, sus opciones son:

  1. Orar.
  2. Haga múltiples copias, en múltiples dispositivos.

En su "opción 1" (mucho más espacio) podría aumentar marginalmente sus probabilidades al hacer múltiples copias en el mismo hardware, pero el hecho es que el hardware falla, no con poca frecuencia haciendo que todo el disco sea ilegible. Una sola copia no es una estrategia de respaldo viable.

No estoy claro si se trata de una copia de seguridad real (de archivos en un dispositivo primario) o un archivo (de archivos eliminados del dispositivo principal). La copia adicional es algo más importante si le interesa el caso de archivo - en el En el caso de la copia de seguridad, en teoría hay una copia principal, por lo que debe tener al menos dos fallas antes de que no tenga suerte.

Ecnerwal
fuente
1
Si bien sus recomendaciones son válidas y apreciadas, eso no es lo que pregunté. Parece estar insinuando que todas las acciones que sugerí no tienen sentido / son inútiles en términos de longevidad. ¿Eso es lo que estás diciendo?
einpoklum
1
Lo sentimos, pero la oración no es realmente desde un punto de vista "profesional".
oldmud0
2
Si eres un buen ingeniero, rezarás a Murphy, y tus ofrendas consistirán en más hogares para esta información, porque cualquier cosa que pueda salir mal, saldrá mal. Otras deidades y ofrendas pueden tener resultados menos satisfactorios ...
Ecnerwal
1
Tbh, con una sola copia, buscar el favor divino no es la peor idea.
Journeyman Geek
5

Si tiene más espacio libre que el que usan los datos de respaldo , su opción 1 en la pregunta, o si tiene varias copias de los datos, tengo una idea que "haría algo"; si cree que SpinRite realmente ayuda con el "mantenimiento" del disco duro y / o desea sobrescribir completamente y luego volver a escribir cada bit de sus datos, esto lo haría.

Si debe hacer algo o no, no estoy muy seguro ... la descomposición de bits o la degradación de datos parece existir realmente, y preguntas como esta aquí en el superusuario y esta en el servidor por defecto parecen aconsejar copias de seguridad o tal vez un error. corrección o RAID tolerante a fallas (pero para un solo disco duro elegiría múltiples copias de seguridad y comprobaciones de hash / CRC y no me preocuparía de qué hacer si falla una RAID).

Me estoy inclinando hacia el enfoque más simple y perezoso de "no hacer nada", pero lo siguiente es al menos una buena idea "asegúrate de que todavía puedo leer mis datos una vez al año, y podría reescribirlos también" .

Linux DIY Emulation de algunas características de mantenimiento de SpinRite

Mucha gente parece convencida de que SpinRite realmente funciona, pero no es gratis y ejecuto Linux, así que he escuchado ¿CÓMO funciona SpinRite de Steve Gibson ? video y dice que una de las cosas que SpinRite hace ahora es:

  • Lee todo el disco
  • Voltea los pedazos y los escribe
  • Los lee de nuevo
  • Voltea los bits y los escribe
  • Los lee de nuevo

Si la unidad encuentra algún problema (menor), esto debería "inducir a la unidad a intercambiar los sectores defectuosos por otros buenos".

¿Con qué frecuencia debes hacer esto? Steve dice que "nadie sabe con qué frecuencia es eso, pero cada pocos meses debería ser suficiente" . Solo estoy adivinando cada 6 meses o cada año más o menos.

badblocks

El proceso de lectura / volteo / lectura / volteo suena casi idéntico a lo que badblockshace cuando usa su prueba de modo de escritura ( -wopción) solo que realmente no "voltea" sus datos, sino que escribe, lee y voltea destructivamente bits en la partición:

Con esta opción, badblocks explora los bloques defectuosos escribiendo algunos patrones (0xaa, 0x55, 0xff, 0x00) en cada bloque del dispositivo, leyendo cada bloque y comparando los contenidos.

No es coincidencia que esos patrones sean, en binario: 10101010, 01010101, 11111111, 00000000.

Así que badblocks escribe, lee y voltea bits con bastante profundidad, y también es gratis. Si ha mke2fsejecutado badblocks (con badblocks -cc), guardará la lista de badblocks, por lo que ext2 / 3/4 los evitará, si se encuentra alguno.

La desventaja es que las pruebas de escritura de badblocks son destructivas , por lo que necesitará al menos dos particiones para que esto funcione (para guardar y volver a escribir sus datos).

  • ¡Guarde dos copias de sus datos en el disco duro , cada una en DIFERENTES PARTICIONES! .
    Esto le permite sobrescribir cada bit en una sola partición con 10, 01, 11, 00 duplica sus posibilidades de recuperación si se desarrollan áreas malas. Y mantenga una lista de sumas de comprobación / hashes para sus archivos de datos, como CRC32 o MD5 (aunque MD5 / SHA son muy lentos en comparación con CRC, y CRC no debe perderse los errores aleatorios)
  • Cada pocos meses:
    1. Lea sus copias de seguridad y verifique que aún coincidan con las sumas de verificación / hashes.
    2. "Pseudo" -bit-flip una partición con badblocks -wo mke2fs -ccSolo UNA partición , no sobrescriba todos sus datos, solo una copia!)
    3. Copie sus datos nuevamente en la partición recién volteada
    4. "Pseudo" -bit-flip la otra partición (una que aún no se ha volteado)
    5. Copie sus datos nuevamente en esa partición recién volteada

Esto es similar a volver a formatear y copiar sus datos, pero un formato rápido / estándar no suele escribir en todos los sectores, por lo que puede terminar sin cambiar / voltear muchos de los bits


La mejor solución es siempre múltiples copias en múltiples dispositivos .
He leído que los medios ópticos podrían ser legibles durante 10, 20, quizás incluso más de 50 años, y que dos discos / ISO idénticos encajarían gddrescue(abajo).
El almacenamiento en la nube a menudo es gratuito para unos pocos GB, almacenar archivos allí (opcionalmente encriptados) puede ser una buena idea, especialmente si las cantidades siguen subiendo.

Además, guardar sus archivos en un archivo de corrección de errores puede ayudar si aparece algún error, pero perder un archivo de un millón puede no ser tan malo como perder un archivo completo de un millón de archivos. Si existiera un software de corrección de errores por separado, como un ECC-CRC, eso podría ayudar, pero no sé de ninguno, y una copia adicional de los datos sería aún mejor.


Relacionado tangencialmente, SpinRite también "se esfuerza mucho" para leer datos de un sector defectuoso de un disco duro, leyendo desde diferentes direcciones y velocidades, que también suena muy similar a gddrescue, en caso (o cuando) tiene problemas para leer sus datos . gddrescue también puede leer dos copias de datos con errores y, con suerte, juntar una copia buena completa, y estoy tentado de hacer dos (o más) copias idénticas de su partición de datos dd, pero si los bloques defectuosos encuentran algún sector defectuoso no podía evitarlos ya que cambiaría las copias idénticas.

Xen2050
fuente
¿Puedes enlazar a una explicación de cómo exactamente haces una partición con badblockso mke2fs?
einpoklum
El cambio de bits no arreglará la dirección del sector que se encuentra fuera del sector. Sé que SpinRite usa inteligentemente algunas propiedades del controlador de disco de una manera bastante sorprendente, que no se deriva fácilmente de las especificaciones, que aún mantiene en secreto. Los chicos detrás de HDD Regenerator pueden haberlo resuelto, pero no es de conocimiento público.
harrymc
¿Hay alguna prueba de cambio de bit hace algo bueno? Suena como el desgaste del disco comercial para resolver un problema del que nunca he visto ninguna referencia, en ningún lugar, en ninguna fuente adecuada y confiable. Una cita sería muy educativa.
Journeyman Geek
@einpoklum He actualizado la respuesta un poco. No tengo un enlace que no sea la página de manual para que los bloques defectuosos sobrescriban cada bit, luego escriba sus datos.
Xen2050
@JourneymanGeek Solo estaba siguiendo lo que dice Steve Gibson en el video vinculado en su sitio, esencialmente "de la boca del caballo". Pero desafortunadamente no tengo y no pude encontrar ninguna otra referencia, al menos desde una búsqueda rápida. De hecho, tengo la impresión de las otras preguntas de SE de que la descomposición de bits puede no ser un motivo de preocupación, y solo reescribir solo, incluso los mismos bits en el mismo lugar, puede causar los "dominios magnéticos en la superficie del disco físico [ para] ser renovado con su fuerza original "
Xen2050
5

Dado que la mayoría de los carteles parecen haberlo pasado por alto, esta es mi respuesta recomendada a los detalles de su pregunta, utilizando esta excelente publicación, ¿Qué medio debe usarse para el almacenamiento de datos (archivo) a largo plazo y de alto volumen? como la guía No volveré a mencionar las referencias e investigaciones de allí, ya que hizo un excelente trabajo, y leer la publicación completa es mejor que el resumen de este caso.

Limitándose a un HDD en almacenamiento en frío (fuera de línea), con las dos opciones dadas, debe conectar el disco cada dos años, o alrededor, y girarlo. La razón principal para hacerlo es evitar que la grasa del husillo se endurezca y se adhiera. La grasa del husillo se endurecerá con el tiempo, y girar el disco de vez en cuando puede retrasar significativamente esa eventualidad. Si desea obtener una idea de la importancia de la grasa para un HDD, observe la cantidad de esfuerzo que Minebea, un fabricante de motores de HDD pone en su investigación al respecto en este informe .

Mientras el disco está conectado, también puede ejecutar algunos diagnósticos SMART para buscar signos de falla inminente de la electrónica, el hardware o el plato. Aunque, según la investigación presentada en FAST'07 por Google y la Universidad Carnegie Mellon {ganador del 'Mejor artículo' ese año}, la prueba SMART puede ser indicativa de fracaso, pero una prueba 'aprobada' puede no ser indicativa de buena salud. Sin embargo, la comprobación no hará daño. Sí, es una investigación antigua, pero nadie parece haberla reemplazado con algo más nuevo.

Tener la unidad funcionando por un tiempo y acceder a los datos también renovará la fuerza de los campos magnéticos que contienen los datos. Algunos argumentan que no es necesario en base a las hordas de evidencia anecdótica, pero las investigaciones que hay parecen indicar que es posible el debilitamiento de los campos magnéticos. Presento tres artículos de la Universidad de Wisconsin-Madison: contaminación de paridad , corrupción de datos y corrupción de puntero de disco . Después de leerlos, puede decidir cuánto amenazan sus conclusiones sus datos y cuánto esfuerzo vale la pena proteger contra ellos.

Rutina de curación sugerida

No sé qué sistema operativo utiliza, qué herramientas tiene o prefiere, ni qué sistema de archivos elige. Por lo tanto, mis sugerencias serán genéricas únicamente, lo que le permitirá elegir las herramientas que mejor se adapten a su configuración y preferencias.

Primero está la configuración para el almacenamiento. Antes de guardar los archivos en el HDD, cree archivos de ellos. Esto no implica compresión, ni la evita. Elija un formato de archivo que le brinde recuperación de errores o habilidades de 'autocuración'. No cree un archivo masivo, sino que archive cosas que estén juntas, creando una biblioteca de archivos. Si elige la compresión, asegúrese de que no interfiera con la capacidad de recuperación de errores. Para la mayoría de los formatos de música, video, películas e imágenes, no tiene sentido hacer compresión. Tales formatos de archivo ya están comprimidos, y tratar de comprimirlos rara vez gana espacio, a veces creando archivos más grandesarchivos, y desperdicia su tiempo y potencia de CPU en el negocio. Aún así, archívelos para la recuperación de error anterior. Luego, cree una suma de verificación para cada archivo de almacenamiento, utilizando el algoritmo de resumen de su elección. La seguridad no es el problema aquí, simplemente una verificación de la cordura del archivo, por lo que MD5 debería ser suficiente, pero cualquier cosa funcionará. Guarde una copia de las sumas de verificación con los archivos de almacenamiento yen segundo lugar en el mismo HDD, quizás un directorio dedicado para la colección total de sumas de cheques. Todo esto se guarda en el disco. Lo siguiente, y bastante importante, es guardar también en ese HDD las herramientas que usó para crear las sumas de verificación y restaurar los archivos (y descomprimirlos también, si usó compresión). Dependiendo de su sistema, estos podrían ser los propios programas, o podría ser el instalador de ellos. Ahora puede almacenar el HDD como lo desee.

El segundo es el almacenamiento. Los discos duros actuales están razonablemente protegidos del choque físico (sacudidas y golpes de rebote), pero tampoco tiene sentido empujarlo. Guárdelo de la manera que ha mencionado en su pregunta. Me gustaría agregar para tratar de evitar áreas donde es probable que esté sujeto a fuerzas electromagnéticas. No en el mismo lugar cerrado que el panel del interruptor de circuito o encima de su radio HAM, por ejemplo. Un rayo a millas de distancia es algo que no puedes evitar, pero la aspiradora y el poder dicen que son evitables. Si quieres ser extremo, consigue un escudo de Faraday o una bolsa de Faraday para ello. De ustedes, dos sugerencias son inútiles o malas. Cambiar su posición física mientras está almacenado no afectará nada de lo que importa, y sacudirlo podríacausar daños, ya que la mayoría de las unidades no deberían tener una buena protección contra G-shock, pero es posible.

Las últimas son las medidas periódicas. En un horario que elija, anualmente o semestralmente, por ejemplo, retírelo del almacenamiento y vuelva a conectarlo a la computadora. Ejecute la prueba SMART y lea los resultados. Esté preparado para reemplazar el disco cuando los resultados SMART muestren que debe hacerlo, no "la próxima vez", sino "esta vez". Mientras está conectado, verifique todos los archivos con sus sumas de verificación. Si alguno falla la verificación, intente utilizar las capacidades de recuperación de errores del formato de archivo para restaurar ese archivo, recrear el archivo y su suma de verificación y volver a guardarlo. Como también dio la opción 2 de tener una "buena cantidad" de espacio libre, copie los archivos en nuevos directorios y luego elimine los originales. Simplemente "moverlos" puede no moverlos en absoluto. En muchos sistemas de archivos más nuevos, mover el archivo cambiará en qué directorio aparece, pero el contenido del archivo permanecerá donde está. Al copiar el archivo, obliga a que se escriba en otro lugar, luego puede liberar el espacio eliminando el original. Si tiene muchos archivos de almacenamiento, es probable que ninguno sea tan grande como para llenar el espacio libre en el HDD. Una vez que haya verificado o restaurado todos los archivos y haya movido los que elija, restaure su embalaje y vuelva a guardarlo hasta la próxima vez.

Cosas adicionales a las que prestar atención. Cuando actualice su sistema o, peor aún, cambie a un sistema operativo diferente, asegúrese de que todavía tiene la capacidad de leer ese disco duro en la nueva configuración. Si tiene algo que no es texto sin formato, asegúrese de no perder la capacidad de leer el archivo como guardado. Por ejemplo: los documentos de MS-Word pueden tener ecuaciones creadas en un formato, las versiones más recientes no pueden leerlas. Mira esto para ese mismo problema. Sin embargo, Word no es la única fuente posible de problemas, y ni siquiera los formatos de código abierto garantizan que sus datos estén preparados para el futuro. Para un gran error en este ámbito, lea sobre el fallido proyecto del Libro Digital Domesday. A medida que aparezcan nuevas tecnologías, considere actualizar su colección también. Si tiene películas guardadas como archivos AVI y le gusta más MKV, conviértalas. Si tiene documentos de procesamiento de texto y actualiza su programa, vuelva a guardar los archivados en el nuevo formato.

Tejedor de hechizos gitano
fuente
4

Los medios magnéticos pueden desvanecerse con el tiempo y el resultado es un bit o sector defectuoso. Una solución puede ser renovar la parte magnética una vez cada pocos años.

La forma más simple es copiar y reescribir todo el disco duro, aunque esto puede no renovar la dirección del sector, que es el "encabezado" del sector que permite que el firmware coloque la cabeza en él. La renovación de la dirección de sector puede requerir el formateo del disco (formato profundo, no rápido).

Una solución alternativa es utilizar productos de regeneración de disco. Estos productos escanean el disco a nivel físico, leen cada sector y su dirección y reescriben ambos para renovar los datos magnéticos.

La ventaja adicional es que en caso de un error de lectura, estos productos probarán varios métodos de lectura para guardar los datos, marcarán el sector como incorrecto y lo reasignarán a un sector de repuesto (la mayoría de los discos duros tienen sectores de repuesto) para que Se guardan los datos.

Aquí hay algunos de estos productos:

  • DiskFresh (gratis para uso privado y no comercial o $ 25) - Parte de las utilidades de Puran que obtienen buenas críticas. Solo le informa si hay sectores dañados / defectuosos y no realiza una recuperación avanzada.

  • SpinRite ($ 89 con garantía de devolución de dinero): esto no se actualizó durante varios años, aunque todavía salvó mi disco hace unos años. No confiaría en la garantía de devolución del dinero ya que el producto es bastante antiguo.

  • HDD Regenerator ($ 89.99 con garantía de devolución de dinero): un producto más nuevo con buenas críticas.

En aras de la integridad de los lectores que buscan un almacenamiento seguro a largo plazo, quisiera señalar que existen productos de DVD y Blu-Ray "escribir una vez, leer para siempre", comercialmente calificados como M-DISC o Archival Disc.

harrymc
fuente
Sé que SpinRite usa su propio medio de arranque; ¿Qué hay de los otros que mencionaste? ¿Están basados ​​en Windows? Basado en Linux? Basado en arranque propio?
einpoklum
1
DiskFresh se ejecuta en Windows y HDD Regenerator funciona tanto en Windows como en el disco flash de arranque.
harrymc
Entonces, tal vez debería preguntar si hacer el equivalente de eso en Linux requiere un arranque por separado, o si simplemente puedes conformarte con /dev/sdXlos archivos del dispositivo ddo algo similar.
einpoklum
1
@einpoklum: Cualquier producto (s) en cualquier sistema operativo que realice un formateo profundo e imágenes de disco y reescriba hará el trabajo, incluyendo dd para la parte de reescritura. El punto es renovar completamente todos los sectores del disco, sectores utilizados tanto para datos de archivos como para metadatos. Al copiar el disco se requiere un almacenamiento temporal alternativo, pero hoy eso es barato.
harrymc
@einpoklum: se puede usar DiskFresh para el mantenimiento y solo usar las utilidades más avanzadas para recuperarse de errores (el éxito no está garantizado). DiskFresh debería ser suficiente en condiciones de almacenamiento correctas.
harrymc
3

No se debe realizar ningún tipo de mantenimiento . Volver a conectar el disco y encenderlo representa un riesgo mayor que tenerlo funcionando continuamente y mucho más que dejarlo dormir en una caja. Por lo tanto, verificarlo con mucha frecuencia aumentaría la probabilidad de daño.

La forma en que lo almacena es excelente, pero no se olvide de la temperatura . No dejes que sea extremo. ¿Qué usas exactamente como unidad de respaldo? Algunos son mucho más duraderos que otros.

Algo que puede hacer, ya que tiene suficiente espacio como lo indicó, hacer dos copias de los mismos datos en el HDD . En caso de sectores defectuosos, estará bien. Por lo que noté, la mayoría de las unidades hoy en día sufren daños en el sector al comienzo de la unidad (los primeros GB), pero eso se debe principalmente al sistema operativo (no a su caso). En general, los sectores defectuosos aparecerán inicialmente en la mayoría de los casos agrupados, por lo que es útil tener dos copias de los datos en la misma unidad.

Si tiene solo algunos archivos críticos, sería una buena práctica guardarlos en otro lugar también, solo para estar seguro. Haga un archivo encriptado y póngalo en un palo o déselo a alguien de su confianza.

Overmind
fuente
1
La parte de 'notas' enumera qué HDD específico se utiliza (Toshiba STOR.E basics 750 GB). Además, ¿puede vincular a algún tipo de referencia para afirmar que encender y conectar las unidades disminuye el tiempo estimado de falla? No es que no haya razón para el reclamo, es solo que otras personas están sugiriendo lo contrario esencialmente.
einpoklum
¿Hay algo que pueda citar como base para afirmar que no se debe realizar ningún mantenimiento y que encenderlo es un riesgo mayor?
Fixer1234
No estoy de acuerdo con el argumento de que no hay mantenimiento, ya que incluso un disco que se deja sin alimentación puede ir mal, y si no tiene alimentación, nunca lo detectará.
harrymc
Estadísticamente, es mucho más probable que se dañe cuando lo enciende para una verificación en comparación con no acceder a él en absoluto.
Overmind
No he visto ninguna estadística de este tipo, e incluso si existe, ciertamente no se aplican cuando se enciende una vez durante varias horas una vez cada pocos años . Se necesitarían miles de encendidos para causar daños medibles en un disco.
harrymc
3

Siempre he sentido que el truco es asumir que su disco fallará . Hay algunos modos de falla que son aleatorios. Para fallas no aleatorias, hay dos aspectos aquí: la unidad y el sistema de archivos.

Si bien es un poco una fuente inusual, este hilo de reddit sugiere que un bit dado puede voltearse en 10 años más o menos, aunque sospecho que ECC manejará silenciosamente un solo bit volteado, ya sea en el sistema de archivos o en la unidad misma.

Por lo general, puede encontrar problemas de 'gran escala' relacionados con la edad con las pruebas SMART periódicas, analizando cosas como sectores reasignados pendientes. Con los ciclos de trabajo relativamente cortos, realmente no deberías ver mucho, pero estamos siendo un poco paranoicos aquí. Una vez más, hasta que las cosas se pongan realmente mal, su disco probablemente lo manejará en silencio en ECC.

Finalmente, existe el riesgo de muerte súbita por unidad o controlador . En teoría, puede alimentar el disco, ejecutándolo a temperaturas controladas y frías, que se sabe que maximizan la vida útil del disco, pero nunca me han molestado los discos.

Se supone que las unidades tienen un cierto número de vueltas y vueltas (no es un problema aquí), y sospecho que expulsar correctamente la unidad permitiría que los datos se vacíen a la unidad, y hay herramientas para apagar las unidades. Creo que hdparm haría eso, pero necesito un poco más de pruebas.

Finalmente, elijo las unidades que se sabe que duran . También giro unidades externas cada pocos años, moviendo las unidades más antiguas en la jerarquía.

En teoría, los sistemas de archivos como ReFS y zfs están diseñados para reducir el riesgo de pérdida de datos a través de sumas de verificación de datos integrales. Por lo menos, no tendrás archivos que se corrompan silenciosamente. Elegirlos en sistemas de archivos más comunes probablemente reduciría la posibilidad de pérdida de datos, pero todavía no hay una forma "fácil" de implementarlos en un sistema operativo de escritorio. ZFS tiene un soporte bastante decente en Linux y ninguno en Windows, y ReFS aún no ha llegado al escritorio de Windows. Estos están diseñados para tener múltiples copias en una o más unidades para la recuperación real, por lo que no funcionaría exactamente aquí.

Journeyman Geek
fuente
2
Técnicamente, las sumas de verificación en ZFS (y tal vez ReFS) no hacen nada para reducir la pérdida de datos por sí mismas, solo verifican la integridad de los datos. Aún necesitará una unidad de paridad o espejo (es decir, algún tipo de redundancia) para recuperarse de cualquier error / corrupción. No creo que haya ningún sistema de archivos (popular) que pueda recuperarse por sí solo con una sola unidad (y si existe alguno, tendrán que sacrificar el espacio en la unidad para hacerlo).
Bob
Actualizado para reflejar eso. No se molestó en ir mucho más lejos porque estos sistemas de archivos realmente no funcionarían en su caso de uso /
Journeyman Geek
Sí, el único beneficio para las sumas de verificación en este tipo de escenario es que al menos sabe en qué archivos / unidades no debe confiar.
Bob
¿Por qué se reasignarían los sectores cuando el HDD solo esté allí? Quiero decir, podría sugerirme que verifique las estadísticas SMART después de copiar todo el contenido del disco en algún lugar temporal (¿o /dev/nullquizás?), Y esto provocaría errores y reasignaciones.
einpoklum
Esa es una buena pregunta: eso no debería suceder en absoluto en circunstancias normales, especialmente con ciclos de trabajo bastante mínimos. Sin importar lo repentino e inesperado, y la muerte muy terminal de su disco duro, es poco probable que suceda algo en realidad. La mayoría de los modos de falla que se me ocurren tienden a ser inesperados.
Journeyman Geek
2

Como vemos en las recomendaciones de otros, un solo recurso de respaldo no es una solución confiable SI el respaldo tiene algún valor. La experiencia con dispositivos electrónicos nos ha enseñado a muchos de nosotros (por las malas) que no se trata de IF sino de CUANDO un dispositivo de respaldo fallará.

Los discos duros, por diseño, son para el almacenamiento de datos a relativamente corto plazo. Dos excelentes artículos, /server/51851/does-an-unplugged-hard-drive-used-for-data-archival-deteriorate y ¿Cuánto tiempo hasta que un disco duro no utilizado pierda sus datos? Discuta la vida útil de los datos almacenados en un disco duro. Como siempre, su kilometraje puede variar.

La solución de respaldo que describa es mejor que ninguna copia de respaldo, pero aún tiene un único punto de falla. Con su copia de seguridad en un solo dispositivo, corre el riesgo de perder la ÚNICA copia de sus datos en caso de incendio, inundación, robo, explosión, falla del dispositivo, etc. Entonces, la pregunta es: ¿Sus esfuerzos para preservar su copia de seguridad son un gasto digno de su tiempo?

Para lograr su objetivo, es decir, una copia de seguridad en la que puede confiar, se requiere más de una copia de seguridad. Si va a almacenar sus datos en un disco duro, su copia de seguridad requiere una "actualización" ocasional para contrarrestar la degradación de datos de almacenamiento a largo plazo inherente a las unidades de disco duro. Si usara sus zapatos, compraría una segunda unidad de respaldo similar a la original y una vez al año copiaría los datos de la unidad primaria a la unidad secundaria. Al final de cada año, invierta el proceso y copie los datos de la unidad secundaria de nuevo a la unidad primaria. Enjuague y repita cada año. Una de las unidades debe permanecer fuera del sitio, alejada de su ubicación para evitar perder su única copia de datos en un desastre natural.

John Littleton
fuente
Si bien todo lo que dices es cierto, solo el último párrafo responde a la pregunta.
einpoklum
¿Hay algo que pueda citar como base para el beneficio de refrescarse y el plazo de un año?
Fixer1234
1

No pude encontrar ninguna información creíble y científicamente respaldada sobre esto. En términos generales, hay dos aspectos de este problema:

  1. Rotura de bits : varios efectos físicos pueden voltear los bits almacenados en dominios magnéticos almacenados en los platos del HDD, dañando así los datos en el HDD. (el disco sigue siendo completamente funcional)
  2. Problemas mecánicos : encender / apagar la unidad, mantener las bandejas girando o estacionarias, las condiciones de almacenamiento y el envejecimiento natural pueden hacer que la unidad quede inutilizable después de un tiempo. (los datos aún pueden estar intactos y recuperables)

La putrefacción de bits se trata en este hilo de 2008. El usuario arnaudk escribió:

Por lo que puedo determinar, parece que tomaría unos 22 años (detalles a continuación) para que pierda sus datos debido a la desmagnetización impulsada térmicamente si el disco duro estuviera inmóvil a temperatura ambiente en un rincón oscuro. En realidad, este tiempo será un poco más corto debido a las vibraciones mecánicas y los campos magnéticos externos que surgen debido a todo, desde el motor del disco duro hasta tormentas eléctricas a 50 km de distancia.

Los niveles aceptables de disminución de la señal varían según el diseño del sistema, pero generalmente oscilan entre 10-20% [ref4], por lo que tomaría (-1/326000) * ln (0.8) = aproximadamente 22 años para que un dominio de bits completo obtenga un 20% más débil causando la posible pérdida de datos debido únicamente a los efectos de desmagnetización térmica.

(enlace directo a la publicación)

Esa es la única estimación que pude encontrar. Si eso es correcto, entonces podría reescribir con seguridad toda la unidad cada 5 años para "actualizar" los datos.

Los problemas mecánicos son aún más misteriosos. Backblaze es una empresa que utiliza miles de discos duros de calidad para el consumidor en su centro de datos y publica regularmente actualizaciones sobre su bienestar. Según sus estimaciones, después de 4 años de girar 24/7, el 20% de los discos duros murieron y, si la tendencia continúa, después de 6 años, la mitad de ellos desaparecerá. Esto está más o menos en línea con las cifras de este documento técnico de Google . Sin embargo, ese no es un caso de uso estándar para un disco duro y apenas podemos compararlo con una unidad que se encuentra fuera de línea en una caja. No conozco ningún estudio que aborde este caso.

En general, si realmente le interesan esos datos, debe conservar dos copias de ellos y trasladarlos a un nuevo HDD probado con estrés cada 5 años más o menos. Eso debería mantener dominios magnéticos y hardware razonablemente frescos, pero YMMV.

gronostaj
fuente
0

Aumentar la vida útil de una unidad de disco duro es una de las cuestiones en las que obtiene el mejor resultado al hacer menos. Desenvuélvalo, colóquelo en una plataforma sólida lejos del calor intenso, la humedad, el polvo o la radiación, donde haya suficiente circulación de aire y la menor probabilidad de que un niño lo rompa por accidente. Puede esperar una larga vida de su disco duro hasta que llegue el momento de actualizarlo.

Quizás es difícil aceptar que, como consumidor, hay muy poco (incluso nada) que pueda hacer para aumentar la longevidad del disco duro. Pero ciertamente hay formas de mejorar las posibilidades de supervivencia de sus datos: ReFS, RAID y copia de seguridad.

Créame, la industria está trabajando para mejorar la longevidad de los datos en lugar de los discos duros.


fuente
Protegerlo de daños es un buen consejo. ¿Hay algo que pueda citar para respaldar la afirmación de que hay poco que aumente la longevidad?
Fixer1234
-1

En mi experiencia, el cambio frecuente de inicio / parada (inactivo / funcionamiento) es malo para los discos duros, es mejor mantenerlos siempre girando si está de acuerdo con que consumirá más electricidad. (Probado en múltiples sistemas con los mismos discos duros de la misma tienda, donde algunos discos duros forzados siempre giraban y otros no)

En todos los servidores, ejecutamos de forma regular las pruebas SMART "cortas" por día y las "pruebas largas" durante el fin de semana que, al menos, pueden dar una idea de cuándo fallará el HDD. Si usa ZFS, es suficiente "fregar" regularmente una vez al mes para las versiones empresariales de HDD y una vez cada 2 semanas para HDD de grado de consumo.

Una fuente de alimentación buena y decente también es uno de los factores para un HDD saludable, además de UPS que evitan que las sorpresas de electricidad al azar se desvíen al HDD. (Los discos duros externos obtienen energía de la computadora, por lo que también se aplica a ellos)

La vibración / agitación mientras HDD está funcionando no es bueno para ellos tampoco. (Especialmente importante para HDD portátil: no moverlos mientras funciona)

Además, elegir el modelo adecuado para los trabajos particulares de HDD (vigilancia, NAS, escritorio ...) es una forma de extender su vida

Alex
fuente
1
No creo que lo ejecute en la caja ...
Journeyman Geek
En realidad no lo ejecuto ... es solo una copia de seguridad. Por supuesto, no lo ejecutaría desde el interior de la caja :-) Por esa razón, el consejo sobre un UPS o vibraciones, etc. es irrelevante para mi caso (sería relevante para un disco que está en uso constante / frecuente.)
einpoklum
No diría que UPS es irrelevante. Incluso si se trata de una unidad de copia de seguridad externa, aún necesita alimentación y, en caso de que ocurriera algo en las líneas eléctricas, algo debería proteger tales situaciones.
Alex
Aquellos que voten en contra, por favor dejen una razón en los comentarios. Es un tema interesante, así que me gustaría saber qué pasa. Tu opinión beneficiará a todos.
Alex
-3

En términos generales, si se trata de un sistema Linux, nunca se necesita mantenimiento. Los sistemas Windows parecen perder clústeres con mucha más frecuencia que Linux. Por esa razón, un chkdsk cada 3-6mo es inteligente en el sistema Windows.

Todas las piezas del disco duro con casquillos y cojinetes eventualmente tienen alguna desalineación debido al desgaste después de 5 o más años de uso constante. La mejor manera que he encontrado para no despertar algún día con una partición dañada es formatear al menos cada 5 años.

En general, tengo algo que requiere una revisión importante de mi sistema cada dos años y, por lo tanto, vuelva a formatear en ese momento (asegúrese de usar un reformateo completo con verificación de errores). Mi memoria es lo suficientemente buena como para notar una disminución en el espacio del disco duro después del formateo; Esto es una indicación de que la unidad está fallando. Si una persona no está familiarizada con su sistema, podría mantener registros del conteo exacto de bytes después del formateo.

En algún momento se utilizarán los sectores "adicionales" (específicamente para este propósito) y el sistema comenzará a marcar áreas "normales" en la unidad como inutilizables: el recuento de bytes disminuirá. En este punto, la unidad debería ser eliminada; probablemente ya habrá pérdida de datos. Esto es normal para un disco duro que se mantiene 24/7 en 5-10 años.

La única forma de prolongar la vida útil del disco es configurar el sistema para que se apague después de unos minutos de inactividad. Tengo una unidad de 2 tb que uso como copia de seguridad maestra y la configuro para que se apague después de 10 minutos sin uso. Puedo pasar 30 días sin acceder y, por lo tanto, permanece apagado. Tarda 20 segundos en encenderse y volverse legible si es necesario.


Entonces, si la discusión se limita a la vida útil, no se activará periódicamente; luego están las preocupaciones ambientales bien cubiertas cubiertas en el enlace anterior "¿Cuánto tiempo hasta que un disco duro no utilizado pierda sus datos?" El único problema que no vi mencionado en esa discusión sobre la electrónica sin alimentación es la vida útil de los condensadores. Duran más por uso periódico; de lo contrario se secan; Esta es la estructura electroquímica de un condensador (y baterías).

La regla general para la vida útil del condensador es de 20 años. Esto se llama la regla 20/20. La falla del condensador será mayor en los primeros 20 minutos de uso, luego la falla estadística se superará nuevamente después de 20 años de uso. Pero fallan mucho antes de 20 años si no se usan.

La falla más común (en general) en los componentes electrónicos son los condensadores. Los condensadores (electroquímicos), luego los inductores y transformadores (electromecánicos) se desgastan si se usan o no.


Una compañía llamada Backblaze ha recopilado datos sobre fallas del disco duro. Ha publicado esos datos en los blogs de la compañía, destacando qué unidades del fabricante fallaron con más frecuencia que otras.

En un blog reciente , publicó datos que indican exactamente qué 5 atributos SMART indican una falla inminente de la unidad:

From experience, the following 5 SMART metrics indicate impending disk drive failure:

    SMART 5 – Reallocated_Sector_Count.
    SMART 187 – Reported_Uncorrectable_Errors.
    SMART 188 – Command_Timeout.
    SMART 197 – Current_Pending_Sector_Count.
    SMART 198 – Offline_Uncorrectable.

Puede elegir un subconjunto como estas 5 estadísticas sugeridas porque son consistentes entre los fabricantes y son buenos predictores de fallas.

El artículo continúa sugiriendo:

SMART 5: Reallocated_Sector_Count 1-4 vigílelo , más de 4 reemplazan

SMART 187: Reportado_ Incorrecto 1 o más reemplazar

SMART 188: Command_Timeout 1-13 vigílelo , más de 13 reemplazan

SMART 197: Current_Pending_Sector_Count 1 o más reemplazar

SMART 198: Offline_Uncorrectable 1 o más reemplaza

jwzumwalt
fuente
44
> Los sistemas Windows parecen perder clústeres con mucha más frecuencia que Linux. Por esa razón, un chkdsk cada 3-6mo es inteligente en el sistema Windows. [cita requerida] - No he escuchado ese consejo antes. No desde 2007, de todos modos. Y es bastante ortogonal a la pregunta, que principalmente pregunta sobre el hardware en el almacenamiento apagado, hardware que realmente no le importa qué tipo de sistema de archivos está utilizando.
Bob
1
Además, usar cualquier tipo de conteo de 'sector defectuoso' a nivel del sistema de archivos para verificar el estado de la unidad es ... extraño. Para eso existe SMART. Lo que también incidentalmente informa tanto el recuento de sector reasignado como el recuento de sector [reasignación] pendiente (y si cualquiera de ellos es cualquier cosa menos 0, es hora de reemplazar la unidad).
Bob
1
Esta respuesta, si bien puede contener información útil (si es algo más que una conjetura) no responde a los requisitos claros establecidos en la pregunta, que fue específicamente sobre el cuidado y mantenimiento adecuados para la máxima longevidad del hardware apagado.
music2myear
1
@jwzumwalt No considero que la (no) existencia de una herramienta incorporada sea ​​particularmente importante: los datos están allí, el hardware y el firmware lo admiten y es accesible por software, por ejemplo, CrystalDiskInfo. (Y si está tratando de comparar sistemas operativos, tampoco hay una herramienta integrada / preinstalada en muchos dstros de Linux, incluido Debian). SMART es en gran medida la forma estándar de la industria de detectar fallas inminentes en el disco (para ser justos). , en un entorno empresarial más grande, es muy probable que dejen que falle y se reemplace después del hecho, yay redundancia).
Bob
1
¿Qué "sistema Linux" o "sistema Windows"? ¿Que usa? Creo que estás hablando de discos que están en uso en un sistema en ejecución, en lugar de responder a mi pregunta.
einpoklum