Cosas clave para buscar en un centro de datos

34

Estoy tratando de crear una lista de verificación simple para determinar la calidad de un centro de datos ... dónde y qué debo buscar y cómo puedo determinar si lo que dicen los propietarios (por ejemplo, "nuestro UPS mantiene el centro de datos durante 100 días sin poder ") es cierto o no? ¿Cuáles son los signos típicos o los centros de datos buenos o malos?

AX1
fuente

Respuestas:

43

Aquí hay una lista de preguntas que hice por mí mismo la última vez que fui de compras al centro de datos:

  • Explique lo que se necesitaría para que los rociadores se apaguen en nuestro equipo.
  • ¿Qué estarán dispuestos a hacer las manos remotas? Por ejemplo, instale discos duros, gire cintas ...
  • ¿Están disponibles sus manos remotas 24/7/365, tiempo promedio de espera para que lleguen a la jaula después de presentar un boleto (¿Cómo se ingresan los boletos?)?
  • ¿Estás en múltiples redes?
  • ¿Tiene piso elevado de enfriamiento?
  • ¿Cuántos centros de datos opera además de este?
  • ¿Cuánto tiempo puede funcionar el centro de datos con energía de respaldo?
  • ¿Podemos entregar equipos directamente al centro de datos?
  • ¿Hay un muelle de entrega y estacionamiento gratuito, cercano y disponible?
  • Si tenemos un proveedor que viene al centro de datos, ¿debemos acompañarlo?
  • ¿Qué temperatura y humedad ambiente se mantiene?
  • ¿Cuántas opciones de ISP hay?
  • ¿Alguno de sus clientes ha perdido energía por algún tiempo en la historia del centro de datos?
  • ¿Cuánto tiempo lleva en funcionamiento este centro de datos?
  • ¿Qué controles de acceso existen tanto para el piso como para el equipo?

Si visita varios y hace estas preguntas entre el precio, las impresiones de su visita y sus respuestas, probablemente tendrá claro cuál desea. Asegúrese de visitarlos siempre y visite una buena cantidad de ellos.

Kyle Brandt
fuente
2
Bien hecho. +1 a ti
gWaldo
3
También preguntaría sobre los controles de acceso tanto al piso como a su equipo.
Scott Pack
Gran lista !! Yo agregaría: "¿Eres dueño del edificio?" Además, si tienen rociadores, ¡aléjese!
JakeRobinson
Los códigos de incendio requieren @JakeRobinson Sprinklers , incluso en centros de datos, en muchos lugares. Cuando vea rociadores, pregunte si son rociadores de tubería seca .
sysadmin1138
3
@JakeRobinson El nuevo DC al que me mudé en 2003 tenía FM200 y rociadores. Los mariscales de bomberos eran muy firmes y tenía que haber rociadores allí. Si el FM200 puede apagar el fuego, genial. Pero si no lo hace (la explosión del UPS infringe la presa de aire FM200 para que el O2 pueda entrar después de un vertedero), mucha agua salvará el edificio. El sistema correcto de tubería seca significa que si se golpea un cabezal de rociadores, la corriente continua no se inunda.
sysadmin1138
6

Kyle lo cubrió bastante bien, pero aquí hay un par de puntos:

La seguridad física es enorme. Debería tomar casi un acto del Congreso (Parlamento, insertar una institución burocrática de lento movimiento aquí) para entrar.

Debería tener supresión de fuego Halon, no rociadores; Los servidores no deben estar húmedos. (Las regulaciones locales de extinción de incendios pueden anular ...)

Descubra cuáles son sus proveedores de servidores preferidos. A menos que sea por una razón muy específica (como ejecutar un centro de datos similar a Google), deberían ser servidores de marca. (Dell, HP, IBM, Sun, Apple, etc.) Si dicen "caja blanca" o una marca que no reconoce, ejecute. Tenga en cuenta que hay algunos proveedores de servidores de nivel inferior acreditados que son acreditados (System76, por ejemplo), pero "a medida" significa que ellos mismos están armando las cosas. Excelente para su hogar, pero malo para su centro de datos. (Esto no incluye comprar un HP Proliant DL580 e instalar cosas como los kits de opciones de memoria o las cajas de unidades).

¿Qué opciones de propiedad hay disponibles? ¿Comprar a través de ellos? ¿Compra directa y envío directo allí? ¿Arrendamiento? VM?

gWaldo
fuente
44
Acuerde la extinción de incendios, aunque para "Halon" lea "halon / FM200 / Argonite / Inergen / otro gas extintor aquí"
MadHatter apoya a Monica el
11
Los rociadores son realmente requeridos por el código de fuego en muchos lugares. Lo descubrí en 2003 durante una compilación de DC con la que ayudé. Solo se supone que dispara si el FM200 no apaga la fuente de calor. Debe ser un sistema de rociadores de tubería seca que respalde el gas inerte.
sysadmin1138
2

Excelente como siempre Kyle, un par de cosas que aprendí de la experiencia:

  • Pregunte si hay generadores para respaldar los UPS, si es así, ¿con qué frecuencia se han probado los generadores?

  • ¿Qué cerraduras físicas y controles tienen instalados para evitar que los electricistas maten la energía?

  • ¿Qué responsabilidad / cobertura de seguro tienen?

  • ¿Cómo manejan las situaciones cuando no cumplen con su SLA?

  • ¿Con qué frecuencia no han cumplido un SLA?

  • ¿Cuánta potencia proporcionan a cada bastidor / jaula / etc.? (¿Tendrá energía limitada y necesitará otro bastidor / jaula solo para obtener energía adicional?)

  • Solicite referencias, en su industria sería bueno.

Historias divertidas que no eran divertidas en ese momento:

  1. Hubo un incendio en Vancouver en un compartimiento eléctrico subterráneo, a 4 cuadras de mi DC, el incendio cortó la energía por un radio de 10 bloques. El UPS mantuvo las luces encendidas hasta que el grupo electrógeno se puso en línea. El grupo electrógeno permaneció en línea durante aproximadamente una hora antes del sobrecalentamiento. Los UPS pudieron mantener las luces encendidas durante otros 30 minutos después de que el grupo electrógeno cerró la seguridad. Gen-set pertenecía al edificio, IIRC DC pudo culparlos y lavarse las manos.

  2. Un electricista le cortó la corriente a un par de filas de bastidores en el DC porque el panel se cayó y abrió todos los interruptores. También he oído hablar de un electricista en otro DC que va a trabajar en un UPS, no lo pone en modo bypass y elimina todo el DC.

Clint
fuente
¿Es aconsejable tener un UPS en rack para esos casos o no importa ya que la conexión generalmente se corta con todo de todos modos?
AX1
Hubiera sido agradable ... Nuestro DC dijo que no se nos permitía tener un UPS en nuestros estantes, nos dieron una razón, pero no recuerdo de qué se trataba.
Clint
Tal vez el calor? No tengo mucha experiencia con UPS en rack, pero los UPS de consumo siempre se calientan.
AX1
44
@ AX1: UPS en una cadena de margarita se ensucian entre sí. Esperan ciertas características en la corriente, y otras UPS pueden filtrarlas. La red probablemente se apagará una vez que el DC pierda energía, por lo que incluso si sus servidores están activos, la red no lo estará.
Quinnr
Podría haber sido un código de incendio, si el EPO es golpeado, los bomberos esperan que no haya energía en vivo.
Sean Reifschneider
1
  • Diría que probablemente un tercio de un centro de datos son las líneas de pedido técnicas (¿Tiene {VESDA, reabastecimiento de combustible de contratos, enfriadores cubiertos por UPS, múltiples redes de energía, diversas entradas de fibra).

  • Otro tercio es cómo lo manejan cuando las cosas no salen bien. ¿Se tragan su orgullo, examinan el fracaso y descubren qué hacer para asegurarse de que no vuelva a suceder? ¿O simplemente siguen haciendo lo que antes no funcionaba?

  • Y el otro tercio es el personal. ¿Son inteligentes, fáciles de trabajar y no se entregan todos los meses?

Pero aún más importante: ¿tienen el espacio que necesita? En un lugar al que casi entramos, en 2 años estábamos usando más espacio del que tenían disponible.

Sean Reifschneider
fuente
1

Trabajo en un pequeño centro de datos en Silicon Valley. Soy el administrador de sistemas del lado del servidor administrado de la empresa.

Malas señales:

  • Falta de monitoreo y alertas redundantes de energía, temperatura, humedad
  • Falta de monitoreo para dispositivos de red, colos, servidores y otros equipos.
  • Desorden y no usar ataduras de cables u otra gestión de cables para mantener estantes limpios y organizados

Buenas señales: - Generador diésel in situ con conmutación por error automática - Refrigeradores de respaldo y controladores de aire con conmutación por error automática - Amplio ancho de banda en las principales redes troncales de los operadores (AT&T, XO Comm) - Proveedores de red redundantes - Enrutadores centrales redundantes, cortafuegos, equilibradores de carga e interruptores - En funcionamiento verificación de memoria y diagnóstico de hardware antes de implementar servidores

Los servidores de marca están bien, pero si son viejos y han estado alrededor del bloque varias veces, es mejor asegurarse de que estén pasando los diagnósticos de hardware antes de usarlos.

Un buen centro de datos debe proporcionar a sus clientes un sitio web donde puedan monitorear el consumo de ancho de banda y el tiempo de actividad. También deben responder cualquier pregunta. Pregúnteles la marca y modelo de su UPS. Pídales que vean la carga actual en el UPS. Con esta información puede verificar cuánto tiempo puede pasar sin energía.

Pero, sinceramente, el UPS no debería ser su preocupación. Un UPS solo proporciona un breve tiempo de actividad (aproximadamente 30 minutos). Una preocupación mucho mejor es si el DC tiene un generador de respaldo. También vale la pena preguntar en qué red está el DC. En términos de apagones y apagones, se asignan diferentes prioridades a diferentes cuadrículas. ¿Adivina qué? Los hospitales y las estaciones de bomberos son de alta prioridad (nunca se corta la electricidad). Si el Centro de datos está en la misma red, se garantiza una potencia confiable.

Pregúnteles cuánta energía disponible por rack. Donde trabajo proporcionamos a cada rack 3 circuitos de 25 amperios. Un servidor típico de 1u consume 1-3 amp.

80skeys
fuente
Al que estoy tentado de ir tiene 40 amperios por rack. ¿Eso es demasiado bajo? Es casi la mitad de lo que dices (75amp).
AX1
1
@ AX1, 40A a 110V es 4400W; a 230V es 9200W. A menos que sea de alta densidad (Twin / Twin ^ 2 / Blade) o HPC / GPU, eso es MUCHO.
Mircea Chirea