Nuestro edificio está ubicado aprox. A 100 metros de las cargas explosivas. Suceden varias veces al día y realmente sacuden mucho todo el edificio. Esto continuará durante muchos días y se supone que las explosiones se harán más fuertes.
Nuestras salas de servidores no son nada lujosas; uno de ellos tiene todos los estantes en concreto duro mientras que el otro tiene un piso elevado (el que permite que los cables pasen debajo de él).
¿Alguien tiene algún consejo, contramedidas o mejores prácticas para nosotros?
Actualmente estamos pensando en las siguientes contramedidas:
- Informe diario de las luces de estado de las salas de servidores (luces HD, fuentes de alimentación, etc.).
- Verificación nocturna de escaneo de disco en los servidores más importantes
- Solicite un suministro adicional de discos duros de repuesto
Editar: ¡Muchas buenas respuestas aquí! Sin embargo, uno debe ser aceptado. La respuesta más votada en el momento de esta edición tendrá su respuesta aceptada.
disaster-recovery
server-room
Chris Dale
fuente
fuente
Respuestas:
Si yo fuera usted, llamaría a la compañía de seguros de la compañía y pediría que coloquen un acelerómetro.
De esta manera, la compañía de seguros sabrá que usted no es el que sacude los discos, y la compañía de seguros sabrá con certeza cuándo se disparó cada explosión, en caso de que su SAN muera exactamente en el mismo momento.
(Hicimos esto)
fuente
Ahora sería el momento de asegurarse de que haya verificado su solución de respaldo. Todo el hardware de reemplazo en el mundo no lo salvará si sus copias de seguridad están corruptas o se han vuelto inútiles.
fuente
Además de todas las otras sugerencias excelentes (especialmente las copias de seguridad externas ), debe considerar proteger el polvo de su habitación en la medida de lo posible: quitar el clima alrededor de las puertas, colocar cinta adhesiva alrededor de las ventanas, etc.
Si tiene entradas de aire externas, planee cambiar el se filtra cuando termina la voladura.
Dicho todo esto, no desperdiciaría tiempo / recursos en escaneos nocturnos de disco, ni dinero en discos duros de repuesto (tal vez compre uno o dos para sus máquinas más críticas, pero recuerde que puede usar unidades nocturnas si es necesario).
El equipo del servidor es sorprendentemente robusto y continuará funcionando durante años en condiciones bastante terribles. Lo más probable es que estés bien.
fuente
Monte sus racks de servidores en plataformas de base ISO . Esto aislará el rack de su servidor de los golpes de tierra y permitirá que sus sistemas funcionen incluso en caso de movimiento.
No es fácil, pero es efectivo. Especialmente en zonas de terremotos.
Para ver la base ISO en acción, vea este video que muestra los efectos en un rack de servidores durante una simulación de terremoto . Un bastidor está montado en una base ISO, el segundo bastidor no.
fuente
Energía: si pierde energía, ¿se reiniciarán todos los servidores, almacenamiento, san (etc.) en su bastidor por sí mismos? ¿O aparecerán solo después de presionar el botón 'Encendido'?
Esto por dos razones:
También puede sugerir a sus usuarios que apaguen y desconecten las computadoras cada noche.
fuente
La mayoría de la gente habla de copia de seguridad, no muchos hablan de la restauración. Asegúrese de que restaurar desde la copia de seguridad sea lo más fácil posible. En particular si el tiempo es crítico.
Si tiene una replicación de ubicación conjunta, cambie los que sean los maestros (si el tiempo lo permite) ya que los de su edificio son mucho más vulnerables. También es más probable que disminuyan durante las horas de trabajo (evidentemente).
También aconsejo trabajar desde casa.
fuente
Toca heavy metal para reemplazar el hard rock mientras explota. El rock duro está tan pasado de todos modos. ;)
Más en serio, tal vez hay una tienda de equipo de DJ a la vuelta de la esquina donde puedes recoger algunas cosas de absorción de impactos / aislamiento. Muchos DJ (de música de baile) tienen dificultades similares cuando tocan discos (es decir, mantener una pequeña aguja en un pequeño surco giratorio, algo comparable a equipos sensibles como unidades de disco) a un volumen extremo mientras las multitudes a su alrededor saltan y se estampan. en el piso sincronizado (el "sincronizado" es importante; si nunca ha escuchado sobre el incidente del Puente Tacoma Narrows , debería considerar ver este clip ). Rasgue algunas bolsas de basura para proporcionar protección adicional contra el polvo.
fuente
Me sorprende que nadie haya mencionado el lado del proceso.
Esta es la oportunidad perfecta para repasar lo que ha planeado para la continuidad del negocio. ¿Cuál es el plan si tiene que mudarse de oficina por un día o una semana? ¿Tiene planes actualizados sobre dibujos y qué sistemas tienen prioridad para la restauración? ¿Se le informa a la gerencia que usted tiene un plan y que conoce
La aceleración de las explosiones que causan estragos en la sala de servidores es probablemente la menor de sus preocupaciones. Sus servicios públicos podrían tener un riesgo mucho mayor a menos que sea autosuficiente con energía in situ y conectividad robusta (suponiendo que no sea autónomo y solo brinde apoyo al personal local).
Si hay una falla en el suministro de agua o en la red eléctrica, ¿puede sobrevivir? ¿Ha llamado a su proveedor de Internet para ver si está al tanto de la explosión y se ha preparado para restablecer el servicio a través de una ruta alternativa si se interrumpen sus servicios públicos? Conocerá sus detalles mejor de lo que podemos suponer, pero debe tener una lista de todo lo que necesita para funcionar y abordar "¿Qué pasa si esto desaparece inesperadamente?" para cada.
Solo repasar esto en su mente / en papel lo ayudará a saber si tiene alguna debilidad que necesite trabajar más adelante y tal vez comunicar esto en la cadena si su organización no tiene nada escrito. Comience con un resumen ejecutivo de dos páginas, solo un FYI para que todos sepan lo que está haciendo.
Sí, tener algunos discos duros / repuestos adicionales a mano es bueno, pero estaría más preocupado por las cosas que no puedo ver o no puedo controlar directamente.
El beneficio real de este ejercicio de proceso es una verificación de la realidad de su sistema de monitoreo actual. Una vez que haya planeado algunos escenarios básicos, estará mejor preparado para lo inesperado. Tener un breve resumen de lo que espera sobrevivir y lo que no será muy útil sin importar por qué sufre una interrupción, y también lo ayudará a impulsar sus esfuerzos para mejorar el monitoreo las 24 horas del día, los 7 días de la semana, en lugar de cuando la base comienza a temblar.
fuente
Solía ejecutar computadoras en una mina que estaba siendo recuperada. A medida que el reclamo se acercaba más y más a la oficina, la sala de datos se sacudía casi a diario al final del día.
Mis contramedidas incluyeron mover los bastidores sobre unos pies de goma dura diseñados para amortiguar las vibraciones. Fueron hechos por Manson y yo solo calculé el peso de mi estante y compré los pies apropiados. Esto pareció arreglar cualquier movimiento dentro del estante. La parte difícil fue levantar la rejilla lo suficientemente suavemente como para deslizar los pies debajo.
Además, como otros habían mencionado, tenía copias de seguridad que probé y mantuve fuera del sitio.
Esos servidores duraron 3 años con sacudidas constantes y fallas relacionadas con el hardware. Los escritorios en la oficina no funcionaban tan bien, ya que 2 de ellos tenían fallas catastróficas en el disco duro.
fuente
Todavía no he visto esto mencionado sobre las copias de seguridad, ¡pero asegúrese de sacarlas del sitio! También es posible que desee hacer una copia de seguridad de las configuraciones de conmutador, firewall, etc.
fuente
Pregúntele a la empresa de ingeniería que realiza la voladura. Las probabilidades son muy buenas, tienen su propio equipo en el sitio o han lidiado con daños por explosión en una sala de servidores vecina en el pasado.
fuente
Vuelva a leer las crónicas de BOFH . Le dará algunas ideas prácticas sobre cómo detener las explosiones. Todo lo demás será solo una contramedida.
En cuanto a las contramedidas, todos los demás han mencionado las copias de seguridad, por lo que evitaré repetir ese buen consejo.
Revise sus raid 5 matrices diariamente y tenga discos de repuesto disponibles ahora. Toda esa vibración no puede ser buena para los husillos, y es sorprendente la frecuencia con la que se pierden arreglos que se pueden guardar debido a una alarma que nadie escucha y una segunda falla del husillo.
Tal vez soy optimista, pero los ingenieros que realizan la voladura generalmente no apuntan a los niveles de vibración para los niveles de energía de "destruir la base del vecino", por lo que estaría más preocupado por las partes móviles de las computadoras, también conocidos como los discos.
fuente
Ponga algo de protección debajo de los bastidores, especialmente el que está en concreto duro. Se sacudirá (o probablemente se sacudirá) mucho. Si no puede comprar (especialmente por el momento) compre un piso resistente a terremotos, coloque un poco de espuma debajo para reducir el temblor.
fuente