He leído la historia sobre el administrador sacando un disco de una matriz RAID 5, y luego una segunda, pero me gustaría probar por mí mismo lo que sucede cuando simplemente desconecto un disco de un sistema en vivo. Es un servidor HP ProLiant DL585 G7 series , por lo que debe ser intercambiable en caliente.
Pero antes de hacerlo, pensé que podría ser mejor obtener información de personas más experimentadas antes de hacer algo realmente, muy tonto.
raid
hp-proliant
hp-smart-array
hotswap
Berzemus
fuente
fuente
Respuestas:
Depende de tu controlador.
Si es compatible con el intercambio en caliente, entonces sí. Si no, entonces podría volar el controlador y matar a toda la matriz.
Si saca una unidad de la matriz (ya sea mientras está funcionando o apagada), tendrá que realizar una reconstrucción completa una vez que la vuelva a colocar, lo que llevará un tiempo y degradará el rendimiento mientras sucede.
Probar su configuración RAID como esta no es una mala idea. Solo asegúrese de que sus copias de seguridad sean correctas y estén actualizadas primero en caso de que algo salga mal y la matriz no sobreviva a la prueba.
fuente
Bueno, de acuerdo con una simple búsqueda, ese servidor debería tener unidades "SAS de conexión en caliente 2.5", por lo que si ese es el caso, sí, debería poder extraer las unidades y colocarlas mientras la máquina está activa. Sin embargo, necesita para verificar su configuración actual.
Esto es algo que debe hacer no solo para impresionar a su jefe, sino más importante, para demostrarse cómo funciona. Deberá tirar de una unidad para asegurarse de que el sistema se mantenga vivo y para asegurarse de que su repuesto dinámico se active de inmediato. También es una buena idea observar el proceso de reconstrucción y observar cuánto tiempo lleva. Reemplace la unidad "faltante" con una unidad diferente y verifique que puede crearla y asignarla como repuesto dinámico. Luego, extraiga la otra unidad que formaba parte de la matriz original y vea si la máquina se mantiene viva y se activa el nuevo repuesto dinámico.
Otra prueba divertida es quitar las unidades con la alimentación apagada, volver a colocarlas en un orden diferente, luego encender la máquina y ver qué dice el controlador.
Es importante hacer esto antes de que la máquina esté en producción para que a) sepa que realmente funciona yb) pueda escribir un procedimiento. Es posible que se sorprenda de la frecuencia con la que una configuración RAID en particular no funciona como se esperaba.
Como eres nuevo en esto, también puedes ver cómo se ve un disco extraído si lo conectas a otra máquina e intentas obtener los datos. También puede experimentar con unidades de diferentes tamaños para saber cómo las maneja el sistema.
Llámame paranoico, pero idealmente también podrías considerar comprar algunas réplicas adicionales de las unidades que vas a usar, y probar cada una antes de que el sistema esté en producción. He tenido muchos problemas estúpidos con pequeñas diferencias de tamaño de unidad entre fabricantes, unidades defectuosas que eliminaron canales SCSI completos cuando se insertaron, etc. La vida es buena si tiene algunas unidades de repuesto que son idénticas a las unidades que está utilizando. utilizando.
fuente
Sí, si son intercambiables en caliente, simplemente puede extraer uno de los discos y las cosas deberían seguir funcionando. Así es como reemplazaría un disco defectuoso.
fuente
Dependiendo del controlador y / o software, debería funcionar, y en muchos casos, la redundancia comenzaría a recrearse unos momentos después de colocar el disco.
Nunca lo haría en un sistema de producción, porque es una carga pesada en los discos, puede llevar horas volver a duplicar los discos (durante este tiempo no tiene redundancia) y y y, pero en teoría se supone que funciona.
En los sistemas de prueba, siempre lo hago antes de ponerlo en funcionamiento, y siempre se ha restaurado ...
fuente
Obtuvimos algunos viejos servidores Dell al limpiar un centro de datos adquirido. Uno de ellos tiene una incursión5 establecida, en el momento en que aún no teníamos esto en nuestra oficina. Así que hice lo único lógico ... Arranqué, comencé algunos procesos y comencé a sacar discos duros para la ciencia. 1 estaba bien, 2 estaba bien, 3 no tanto. Entonces la respuesta corta es sí. ¡Es liberador!
fuente
Una vez saqué un disco de una matriz RAID5 como prueba en vivo de prueba de concepto / hardware mientras estaba en las instalaciones instalando la máquina. Lo había hecho varias veces en la oficina, lo que siempre había estado bien, así que supuse que también sería esta vez. Volvió a entrar, pero tardé dos semanas en jugar con él para que me reconocieran de nuevo ... así que, si estás pensando "¡estará bien!", Bueno, debería ser sí. Pero escuche todos los cuentos de advertencia.
fuente
Sí, lo he hecho (por casualidad, me apresuro a agregar).
fuente