RAID resincronización automática?

11

Verifiqué al azar el estado de mis matrices RAID cat/proc/mdstaty me di cuenta de que una de mis matrices parece estar resincronizando:

md1 : active raid1 sdb7[1] sdc7[0]
      238340224 blocks [2/2] [UU]
      [==========>..........]  resync = 52.2% (124602368/238340224) finish=75.0min speed=25258K/sec

¿Por qué es esto y qué significa? Aparentemente puedo acceder al punto de montaje muy bien con r/wpermisos.

EDITAR 1 (en respuesta a la RESPUESTA de SLM )

Realmente no puedo ver nada si grepa través dmesgy el --detailinterruptor no me dice mucho tampoco, es decir, que muestra que la resincronización está en curso ... pero ningún indicio de la razón o por las que podría haber perdido la sincronización .. . - Supongo que es posible que deba vigilarlo antes de comenzar a cambiar mi hardware.

mdadm synchronization stdcerr
fuente

10

Esto parecería estar indicando que la sincronización entre los 2 miembros del RAID no está sincronizada entre sí.

1. Investigar registros

Investigaría sus dmesgregistros y vería si hay algún mensaje que indique que alguno de los discos duros físicos que componen esta matriz tiene fallas de hardware.

2. Compruebe mdadm

También puede consultar mdadmutilizando el --detailinterruptor para obtener más información sobre la resincronización de esta manera:

$ sudo mdadm --detail /dev/md0
/dev/md0:
        Version : 00.90.03
  Creation Time : Sat Jan 26 09:14:11 2008
     Raid Level : raid1
     Array Size : 976759936 (931.51 GiB 1000.20 GB)
  Used Dev Size : 976759936 (931.51 GiB 1000.20 GB)
   Raid Devices : 2
  Total Devices : 2
Preferred Minor : 0
    Persistence : Superblock is persistent

    Update Time : Fri Jan  1 01:29:16 2010
          State : clean, resyncing
 Active Devices : 2
Working Devices : 2
 Failed Devices : 0
  Spare Devices : 0

 Rebuild Status : 50% complete

           UUID : 37a3bfcb:41393031:23c133e6:3b879f08
         Events : 0.2178969

    Number   Major   Minor   RaidDevice State
       0       8        1        0      active sync   /dev/sda1
       1       8       17        1      active sync   /dev/sdb1

Si ambos dispositivos parecen estar bien y no puede determinar qué dispositivo tiene un problema, puede ejecutar temporalmente una herramienta de diagnóstico como HDAT2 o SpinRite en cada HDD para confirmar su estado.

3. Cableado

Si las unidades de disco duro se comprueban, entonces comenzaría a examinar el cableado, por lo general las cambiaré.

4. Controlador

Luego, escudriñaré el controlador en sí mismo, ya sea sacando las unidades del sistema afectado y diagnosticando en un sistema secundario, o agrego una tarjeta de controlador de terceros en el sistema afectado para diagnosticar el problema aún más.

5. Fuente de alimentación

Lo creas o no, he tenido problemas en el pasado con discos duros y RAID en los que cambiar una fuente de alimentación defectuosa o a punto de fallar resolvió mis problemas de salud de RAID.

slm
fuente

@cerr: sí, si las resincronizaciones siguen sucediendo en lo que parecen ser intervalos aleatorios, entonces es probable que uno de los discos duros esté saliendo, o 3,4, o 5. La manifestación que estás describiendo ha sucedido pocas veces yo y han sido esas situaciones las que han resuelto estos fracasos, para mí, en el pasado.

slm

8

Verifique sus archivos cron, muchas distribuciones realizan una resincronización / verificación programada una vez por semana.

En CentOS 7.1 está en /etc/cron.d/raid-check

# Run system wide raid-check once a week on Sunday at 1am by default
0 1 * * Sun root /usr/sbin/raid-check

Para configurar el comportamiento, edite / etc / sysconfig / raid-check

Sergio
fuente

Aunque generalmente es solo un cheque, no una resincronización ...

frostschutz

2

@frostschutz ... a menos que sea el primer domingo de un mes: serverfault.com/a/255549/299551 En ese caso, se fuerza una resincronización.

Dan

2

En Debian se hace desde:

/etc/cron.d/mdadm

Deshabilitar:

chmod -x /usr/share/mdadm/checkarray

Ver también.

sanmai
fuente