¿Para qué sirve la batería en un controlador RAID de almacenamiento en caché respaldado por batería si el servidor está en una fuente de alimentación ininterrumpida?

10

¿La batería es redundante si el servidor está en un UPS del tamaño adecuado? Hay una opción para forzar el modo de reescritura y quiero comprender el riesgo. Tengo entendido que ayuda contra fallas de energía mientras los datos en la memoria caché no se han escrito en el disco físico. Pero si el servidor está en un UPS, entonces no hay riesgo de pérdida de energía, especialmente si es un UPS inteligente y el servidor está configurado para apagarse con gracia cuando la batería alcanza un estado bajo. ¿Me estoy perdiendo de algo?

RPC
fuente

Respuestas:

22

Tu comprensión es esencialmente correcta.

Permitir que el controlador guarde en caché los datos de escritura en su RAM local mejora la velocidad de escritura, sin embargo, lo expone a un riesgo de que el sistema operativo piense que los datos se han escrito en el disco (porque el controlador lo tiene) y tener un corte de energía antes de que el controlador complete esa escritura . La batería de respaldo permite que los datos en el caché sobrevivan hasta que la máquina se vuelva a encender, lo que mitiga ese riesgo.

En cuanto al beneficio si su sistema ya está en un UPS, ¿qué sucede si excede el tiempo de ejecución de su UPS (posible incluso con un UPS inteligente), o si las fuentes de alimentación del servidor explotan? ¿O si alguien extrae accidentalmente los cables de alimentación?
Muchas cosas pueden causar una falla de energía. Un UPS solo protege contra algunos de ellos.

voretaq7
fuente
14
¡Los cables de alimentación arrancados de repente son un riesgo en la mayoría de los centros de datos!
sysadmin1138
1
Bing en todos los puntos. El costo de un BBWC bien vale la pena, a menos que los datos sean realmente transitorios, puede capturar el evento y recuperarlo de otra manera, y solo desea mejorar el rendimiento forzando el almacenamiento en caché de reescritura.
mfinni
3
No hay riesgo de pérdida de energía? Además de las respuestas de voretaq7, también agregue: Disparo de disyuntor, mal funcionamiento del UPS ... hay muchas cosas que pueden salir mal.
MikeyB
@mikeyB buen punto sobre los interruptores: he estado en al menos un DC donde las patas de alimentación A / B ocasionalmente volvían a un interruptor de piso o panel
voretaq7
Gracias a todos por sus respuestas. @ voretaq7: el servidor también tiene múltiples fuentes de alimentación, múltiples cables de alimentación, UPS y generadores, pero veo su punto en términos del diseño de la tarjeta en sí (sin saber en qué caja puede terminar). @mfinni: esa es buena, pero entonces tendríamos problemas más grandes con los miles de servidores que se caen al mismo tiempo.
RPC
8

Hay dos razones para la batería;

  • ¿Qué sucede si sus PSU / s se apagan repentinamente? Independientemente de un UPS, su sistema está apagado y es posible que haya tenido datos no confirmados en su caché, tener la batería asegura que los datos se escriban correctamente cuando se restablece la energía. Lo mismo es cierto si, por supuesto, tuviste una falla en el sistema.
  • ¿Qué pasa si algo murió en su controlador de disco real, cables o gabinetes de disco? - diga que algo se enganchó en el cable y dañó el conector en cada extremo; nuevamente, es posible que tenga datos en su caché esperando a ser escritos, pero no hay forma de hacerlo ya que la tarjeta, el cable, el gabinete, etc. están muertos. Es posible que deba reemplazar el controlador, si tiene memoria caché respaldada por batería, podría mover esa memoria caché a una nueva tarjeta sin perder los datos.

Ambas son buenas razones, pero para ser sincero, las memorias caché basadas en flash se han hecho cargo recientemente de las respaldadas por batería por razones obvias y las recomendaría primero; dicho esto, si escribes mucho, recomendaría una u otra vez Solo un UPS.

Chopper3
fuente
-1

La batería también permite la capacidad de tener un rendimiento mejorado, así como los fines señalados por voretaq7. Retire la batería y el dispositivo seguirá funcionando pero a una velocidad sustancialmente reducida.

Mitch
fuente
3
Eso específicamente no es correcto en este caso. @RPC declara explícitamente que puede forzar el almacenamiento en caché de escritura sin la batería de su controlador. El almacenamiento en caché de reescritura es lo que mejora el rendimiento.
mfinni
De hecho, estoy seguro de que puede, pero la batería mejora sustancialmente el rendimiento. He trabajado en la solución de problemas de rendimiento degradado en un par de dispositivos de almacenamiento HP MSA 20 y la degradación fue causada por una batería fallida de caché de reescritura. La batería fue reemplazada y el rendimiento aumentó.
Mitch
2
Sí, lo sé. Porque en esas máquinas, la presencia de la batería permite el almacenamiento en caché de escritura. Cuando la batería falla, el almacenamiento en caché de escritura se detiene y el rendimiento disminuye. Cuando se repara la batería, el almacenamiento en caché de escritura comienza nuevamente y el rendimiento mejora. Su controlador le permite forzar el almacenamiento en caché de reescritura, que es lo que mejora el rendimiento , sin la batería.
mfinni
Mitch es una preocupación muy específica, conozco muy bien los controladores HP E / P / i y para esas tarjetas tienes razón, ya que HP hace que sea muy difícil habilitar el caché sin batería, pero esta pregunta no se limita a esas tarjetas y hay muchos que le permiten habilitar el caché sin batería o, de hecho, hacerlo de forma predeterminada, de ahí la preocupación de mfinni.
Chopper3
-1

Si tiene un UPS, puede forzar el caché y no usar la batería en la redada. Si pierde energía sin una tarjeta de banda, puede obtener datos corruptos, para eso están las copias de seguridad.

Y el hecho de que haya perdido energía no significa que su sistema sea tostado. El caché solo contiene 256 megas y se vacía / escribe en HD todo el tiempo cuando está inactivo. No es que contenga todos los datos y nunca los suelte. Siempre está sonrojado.

Un meteorito podría golpear el edificio y hacer estallar todo, no dejes que este mosto te deprima. Ejecuté la incursión 1 con el caché encendido y sin batería sin problemas.

Puedes ponerte realmente anal en esta conversación. ¿Por qué no tener una caída del servidor 4x, copias de seguridad 10x, etc., etc.? No es un gran problema.

Encienda el caché y use su UPS. Si tiene un golpe ps, puede recuperar los datos y tendría que volar durante las horas de trabajo con alguien que usa la computadora y tener la aplicación correcta abierta, guardar datos al mismo tiempo, etc., etc. Así que las probabilidades son bajas, y si sucede que se puede arreglar fácilmente.

RAJ
fuente