¿Con qué frecuencia debo fregar mi RAID?

13

En general, me gustaría saber con qué frecuencia se debe eliminar una matriz RAID. ¿Qué contribuye a la necesidad de fregar con más frecuencia (lectura de datos, escritura de datos, paradas inesperadas, antigüedad de la unidad, tamaño de la unidad, número de usuarios, etc.)?

He estado leyendo el wiki de Arch aquí y todo lo que realmente dice es que el fregado debe hacerse regularmente. Me preguntaba con qué frecuencia es suficiente. Obviamente dependería, pero ¿cuál es un rango razonable? ¿Anual? ¿Mensual? ¿Semanal? ¿Diario? Muchas gracias por cualquier información.

mrfred
fuente
1
¿Qué tan grande es tu matriz? ¿Cuánto tiempo tarda un matorral de su matriz? Las matrices más grandes pueden llevar horas o días para un exfoliante completo. Obviamente, no puede fregar con más frecuencia de la que se necesita para completar un solo fregado. El paquete Debian incluye un script cron que se ejecuta el primer domingo de cada mes.
Zoredache
Depende de lo sucio que esté :)
metacom
@ Zoredache: Eso es exactamente el tipo de cosas que estaba buscando. Dado que las matrices más grandes tardan más, ¿eso disminuiría la frecuencia con la que debería fregar? ¿Aumentar el número de usuarios aumentaría esa frecuencia? ¿Necesita fregar si realmente no está escribiendo muchos datos nuevos?
mrfred
RAID de software? RAID de hardware? ZFS?
ewwhite

Respuestas:

15

La frecuencia con la que debe escanear depende de muchas cosas.

  • Edad de los discos. Cuanto más viejos son, más probabilidades tienen de contener el mal .
  • La calidad original de los discos en cuestión. Es más probable que las cosas vendidas como 'empresa' duren sin errores, y los discos de tamaño 1 + TB de 2014 son mucho más confiables que sus equivalentes de 2009 cuando se enviaron.
  • Cuán sensible es su E / S de producción a las E / S de depuración.
  • Cuánto de su conjunto de datos considera que es su conjunto de trabajo.

Los proveedores de RAID de hardware a menudo incluyen un proceso de depuración en segundo plano por esta misma razón, algunos incluso le permiten ajustar la prioridad de E / S del proceso de depuración que le permite evitar (o reducir en gran medida) la penalización de producción de E / S para una depuración. Por supuesto, si su prioridad es baja y su E / S de producción ejecuta los discos en su mayor parte, probablemente nunca completará un fregado y ni siquiera lo notará hasta que tenga una falla.

Desafortunadamente, no sé si el kernel de Linux desestabiliza la depuración de E / S o no. De cualquier manera, es una buena idea probarlo con sus cargas de productos para asegurarse de que cualquier impacto en el rendimiento sea aceptable. Si es aceptable, ¡bien! Si no es así, puede elegir si agregar o no husillos para permitir E / S scrub + prod o simplemente aceptar el riesgo de posibles fallas de la matriz en el futuro.

Otra cosa que afecta la frecuencia de lavado es el patrón de uso de E / S. Si las cargas de producción solo afectan a una minoría de los discos, la única E / S que normalmente encontraría un bloque defectuoso en la parte inactiva sería su fregado; en ese caso quieres fregar más a menudo. Si las cargas de producción leen de manera rutinaria todo el conjunto de discos (como las copias de seguridad completas diarias), la E / S de producción tropezará con los problemas más pronto y podrá eliminarlos con menos frecuencia.

Un buen plan de acción sería:

  1. Ejecute algunas pruebas para ver si el fregado obstaculizará la producción.
    1. Calcula cuánto tiempo lleva un exfoliante completo mientras lo haces.
  2. Calcule qué porcentaje de su conjunto de discos obtendrá múltiples accesos en una semana determinada (incluya E / S de respaldo, si corresponde, en este cálculo).
  3. Con base en 1 y 2, decida si está en el campamento con menos frecuencia o con mayor frecuencia.

Una vez que tenga esa información ...

  • Si un escaneo completo lleva menos de un día y no afecta notablemente la producción, puede realizarlo una vez por semana.
  • Si una exploración completa lleva menos de un día y afecta la producción, averigüe qué parte de su semana / mes se ve menos afectada e intente ejecutarla.
  • Si un escaneo completo toma más de un día pero menos de una semana y no afecta la producción, ejecútelo tan seguido como cada dos semanas o una vez cada dos meses.
  • Si un escaneo completo toma más de un día pero menos de una semana y afecta la producción, considere agregar recursos para permitir que se ejecute, requiera que se ejecuten escaneos durante las ventanas de mantenimiento programadas o aproveche la capacidad de inactividad / verificación del fregado para realizar encaja y comienza continuamente.
  • Si un examen completo lleva más de una semana, una vez al mes suele ser suficiente. Pero si afecta la producción, necesitará agregar recursos para permitir que se complete.
sysadmin1138
fuente