Quiero construir un servidor de almacenamiento y lo compré 10 x 2TB WD RED's
. El HDD's
recién llegado.
¿Hay alguna herramienta que usen para verificar si hay unidades defectuosas o para defenderse mejor de la mortalidad infantil antes de copiar datos reales en sus discos?
¿Es mejor verificar cada uno HDD
o probar la matriz ( ZFS raid-z2
) copiando una gran cantidad de datos?
Respuestas:
Tuve la misma pregunta hace 2 meses. Después de enviar un disco fallido, el disco de reemplazo falló en mi NAS después de 3 días. Así que decidí probar el nuevo reemplazo antes de ponerlo en producción. No pruebo cada disco nuevo que compro, solo en discos 'restaurados', en los que no confío por completo.
Si decide que desea probar estos discos, le recomendaría ejecutar un análisis de bloques defectuosos y una prueba SMART extendida en el nuevo disco duro.
En un disco de 2TB, esto toma hasta 48 horas. El comando badblock escribe el disco lleno con un patrón, luego lee los bloques nuevamente para ver si el patrón está realmente allí, y lo repetirá con 4 patrones diferentes.
Este comando probablemente no mostrará bloques defectuosos en un disco nuevo, ya que los discos reasignan bloques defectuosos en estos días.
Entonces, antes y después de esto, realicé una prueba inteligente y verifiqué el recuento de sectores pendientes reasignado y actual. Si alguno de estos ha subido, su disco ya tiene algunos bloques defectuosos y, por lo tanto, podría no ser confiable.
Después de esto ejecuto una prueba SMART extendida nuevamente.
Es posible que desee instalar smartctl o smartmontools primero.
Advertencia , el indicador badblocks -w sobrescribirá todos los datos en su disco, si solo desea hacer una verificación de lectura, sin sobrescribir el disco, use
badblocks -vs /dev/sdX
Si después de esto sus valores inteligentes parecen estar bien, confiaría en el disco.
Para saber qué significa cada valor inteligente, puede comenzar a buscar aquí
http://en.wikipedia.org/wiki/Self-Monitoring,_Analysis,_and_Reporting_Technology
fuente
Estos son discos nuevos. O van a fallar o no lo harán. Ya está un gran paso adelante al usar el sistema de archivos ZFS, que le dará una gran visión de su raid y la salud del sistema de archivos ...
No haría nada más que simplemente construir la matriz. Ese es el punto de la redundancia. No podrá inducir una falla de la unidad con los otros métodos enumerados.
fuente
Puedes usar Bonnie ++ para las pruebas. Puede emular perfectamente el patrón de comportamiento del servidor de archivos.
Por ejemplo:
La prueba se ejecutará como usuario 'nobody' y creará / reescribirá / eliminará 100 * 1024 archivos, de 200 a 150000 bytes por archivo, dentro de 100 directorios creados automáticamente debajo de / home / tmp. Y número de pruebas = 300. Puede jugar alrededor del conteo / tamaño de archivo y el número de repeticiones de prueba.
fuente
Por lo general, solo hago un inicio RAID completo y, cuando corresponde, empiezo a llenar el sistema de archivos durante esto, todo el tiempo sabiendo que podría haber un problema debido a unidades muertas. De esta manera, no pierdo el tiempo para algún tipo de pruebas que de todos modos no son confiables y que detectaría las unidades débiles reales de inmediato. Después de eso, aún podría haber alguna posibilidad elevada de fallas en la unidad debido a la "mortalidad infantil", pero no hay una forma práctica de eliminar esto.
En la práctica, ninguno de los últimos cientos de discos que utilicé en un RAID tuvo problemas durante el primer año de funcionamiento.
fuente
Trabajo para una empresa que hace este tipo de pruebas día tras día. Y sí, probamos cada disco duro que compramos. Nuestro proceso comienza con la ejecución de las unidades a través de un programa gratuito basado en DOS llamado HDAT2. Es gratis para descargar. Puede acceder a SMART y algunas otras funciones de la unidad a las que no se puede acceder desde un entorno Windows. Dependiendo de los resultados allí, los ejecutaremos a través de una de varias líneas diferentes de hardware especializado, pero en el fondo, en su mayoría, solo ejecutan la autocomprobación corta SMART, la Prueba larga, un borrado seguro y All Read para verificar los sectores. Mi sugerencia es ejecutar un borrado seguro del disco completo, luego ejecutar una lectura completa y luego una prueba automática breve INTELIGENTE. Este orden es importante ya que una breve autocomprobación puede no encontrar nada si se ejecuta al comienzo de la prueba, pero después de una escritura y lectura completa del disco, puede recoger algo. Espero que esto ayude.
fuente
Podrías usar la suite de prueba del fabricante, o algo como SpinRite para barrer todo el disco. También sería una buena idea mirar los valores SMART , buscando sectores defectuosos y otros signos de vejez / falla.
fuente
Si realmente quieres probar, entonces usa
badblocks
prueba de escritura. Escribirá patrones de datos en el disco y luego los leerá para verificar. Durante esto, estresará un poco su disco. En mi opinión, si se ejecuta con éxito, puede confiar en el disco.Pero creo que ZFS y una buena copia de seguridad son suficientes.
fuente