¿Puedo eliminar un disco de una matriz RAID 1 en vivo?

8

He leído la historia sobre el administrador sacando un disco de una matriz RAID 5, y luego una segunda, pero me gustaría probar por mí mismo lo que sucede cuando simplemente desconecto un disco de un sistema en vivo. Es un servidor HP ProLiant DL585 G7 series , por lo que debe ser intercambiable en caliente.

Pero antes de hacerlo, pensé que podría ser mejor obtener información de personas más experimentadas antes de hacer algo realmente, muy tonto.

Berzemus
fuente
Wow, gracias a todos por las respuestas rápidas ... Voy por ello ^ - ^
Berzemus
He estado allí, hecho eso! Realmente es liberador, me alegro de haberlo hecho, gracias a todos. (Ahora solo tengo que encontrar a alguien para mostrárselo ...)
Berzemus
2
Solo asegúrese de que la matriz se haya duplicado por completo antes de mostrar a alguien (o asegúrese de extraer la misma unidad que hizo esta vez). Es bueno confirmar que los kits funcionan y te protegen como dicen, ¿no?
David Spillett

Respuestas:

22

Depende de tu controlador.

Si es compatible con el intercambio en caliente, entonces sí. Si no, entonces podría volar el controlador y matar a toda la matriz.

Si saca una unidad de la matriz (ya sea mientras está funcionando o apagada), tendrá que realizar una reconstrucción completa una vez que la vuelva a colocar, lo que llevará un tiempo y degradará el rendimiento mientras sucede.

Probar su configuración RAID como esta no es una mala idea. Solo asegúrese de que sus copias de seguridad sean correctas y estén actualizadas primero en caso de que algo salga mal y la matriz no sobreviva a la prueba.

David Spillett
fuente
1
+1 por el comentario sobre tener una copia de seguridad actualizada. ;-)
KPWINC
2
Y asegúrese de que también puede restaurar desde la copia de seguridad.
jay_dubya
Las copias de seguridad se considerarán inválidas hasta que se hayan restaurado con éxito una vez en una máquina de prueba. E incluso entonces, todos deberían ser vistos con mucha sospecha.
Mark Allen
8

Bueno, de acuerdo con una simple búsqueda, ese servidor debería tener unidades "SAS de conexión en caliente 2.5", por lo que si ese es el caso, sí, debería poder extraer las unidades y colocarlas mientras la máquina está activa. Sin embargo, necesita para verificar su configuración actual.

Esto es algo que debe hacer no solo para impresionar a su jefe, sino más importante, para demostrarse cómo funciona. Deberá tirar de una unidad para asegurarse de que el sistema se mantenga vivo y para asegurarse de que su repuesto dinámico se active de inmediato. También es una buena idea observar el proceso de reconstrucción y observar cuánto tiempo lleva. Reemplace la unidad "faltante" con una unidad diferente y verifique que puede crearla y asignarla como repuesto dinámico. Luego, extraiga la otra unidad que formaba parte de la matriz original y vea si la máquina se mantiene viva y se activa el nuevo repuesto dinámico.

Otra prueba divertida es quitar las unidades con la alimentación apagada, volver a colocarlas en un orden diferente, luego encender la máquina y ver qué dice el controlador.

Es importante hacer esto antes de que la máquina esté en producción para que a) sepa que realmente funciona yb) pueda escribir un procedimiento. Es posible que se sorprenda de la frecuencia con la que una configuración RAID en particular no funciona como se esperaba.

Como eres nuevo en esto, también puedes ver cómo se ve un disco extraído si lo conectas a otra máquina e intentas obtener los datos. También puede experimentar con unidades de diferentes tamaños para saber cómo las maneja el sistema.

Llámame paranoico, pero idealmente también podrías considerar comprar algunas réplicas adicionales de las unidades que vas a usar, y probar cada una antes de que el sistema esté en producción. He tenido muchos problemas estúpidos con pequeñas diferencias de tamaño de unidad entre fabricantes, unidades defectuosas que eliminaron canales SCSI completos cuando se insertaron, etc. La vida es buena si tiene algunas unidades de repuesto que son idénticas a las unidades que está utilizando. utilizando.

Boden
fuente
+1 para reorganizar los discos. Algunos controladores tienen un ataque al corazón con esto, pero los mejores simplemente reordenarán su orden en su configuración.
Mark Henderson
1
Desearía poder hacer +2 en realidad, para su segundo comentario sobre la compra de discos idénticos. Tenía un disco que era un 1.2mb más pequeño que el disco que estaba reemplazando (eran discos de 500 gb) y como resultado fue inútil.
Mark Henderson
4

Sí, si son intercambiables en caliente, simplemente puede extraer uno de los discos y las cosas deberían seguir funcionando. Así es como reemplazaría un disco defectuoso.

carne ferroviaria
fuente
1

Dependiendo del controlador y / o software, debería funcionar, y en muchos casos, la redundancia comenzaría a recrearse unos momentos después de colocar el disco.

Nunca lo haría en un sistema de producción, porque es una carga pesada en los discos, puede llevar horas volver a duplicar los discos (durante este tiempo no tiene redundancia) y y y, pero en teoría se supone que funciona.

En los sistemas de prueba, siempre lo hago antes de ponerlo en funcionamiento, y siempre se ha restaurado ...

Sven
fuente
1

Obtuvimos algunos viejos servidores Dell al limpiar un centro de datos adquirido. Uno de ellos tiene una incursión5 establecida, en el momento en que aún no teníamos esto en nuestra oficina. Así que hice lo único lógico ... Arranqué, comencé algunos procesos y comencé a sacar discos duros para la ciencia. 1 estaba bien, 2 estaba bien, 3 no tanto. Entonces la respuesta corta es sí. ¡Es liberador!

Skaughty
fuente
Si sacaste dos discos antes de que fallara, eso me parece RAID-6. Pero sí, ¡lo primero que hice cuando tuve en mis manos mi primer arreglo de 14 discos fue sacar uno!
Mark Henderson
¡¡¡¡¡¡¡¡¡Muy agradable!!!!!!!!!
Kyle Hodgson
1

Una vez saqué un disco de una matriz RAID5 como prueba en vivo de prueba de concepto / hardware mientras estaba en las instalaciones instalando la máquina. Lo había hecho varias veces en la oficina, lo que siempre había estado bien, así que supuse que también sería esta vez. Volvió a entrar, pero tardé dos semanas en jugar con él para que me reconocieran de nuevo ... así que, si estás pensando "¡estará bien!", Bueno, debería ser sí. Pero escuche todos los cuentos de advertencia.

Kyle Hodgson
fuente
0

Sí, lo he hecho (por casualidad, me apresuro a agregar).

Maximus Minimus
fuente