¿Debería preocuparme la configuración de nuestro servidor?

9

Trabajo para una empresa de unas 50 personas. Nuestros dos servidores (idénticos) están personalizados con estas especificaciones:

Xeon E3-1270 V3
Intel Entry Server Board
32 GB DDR3 ECC
2x 256 GB SSD RAID1 (for System)
4x 1TB SSD RAID10 (for Hyper-V VMs)
Windows Server 2012 R2 as Host and VMs

Cada servidor aloja dos máquinas virtuales (2x AD + intercambio de archivos + perfiles móviles, 1x servidor SQL para pruebas, 1x otro (no importante).

Realizamos copias de seguridad diarias utilizando la copia de seguridad de Windows integrada en los objetivos iSCSI alojados en un QNAP NAS (2x 2TB RAID1).

Los servidores no tienen mucha carga y nunca tuvimos ningún problema. La mayoría de nuestros datos se almacenan en la nube (VS Online, SharePoint).

Pero me pregunto si es sensato continuar con esta configuración o si es mejor cambiar a un hardware de servidor profesional, es decir, una máquina grande.

Entonces, ¿cuáles son las trampas y qué debo hacer al respecto?

Martin Walter
fuente
2
" Pero me pregunto si es sensato continuar con esta configuración o si es mejor cambiar a un hardware de servidor profesional, es decir, una máquina grande " . Estas son dos preguntas bastante diferentes, si también está buscando una respuesta integral a la última pregunta, entonces puede Vale la pena posar por separado. Aparte de eso, ¿puedes aclarar tu papel en la organización? Supongo que está a cargo de la infraestructura, pero si no, obviamente no necesita hacer nada.
Lilienthal
1
Aquí puedo pensar en varias respuestas diferentes, por lo que identificar una pregunta central (¿está bien esta configuración? ¿Está bien este hardware? ¿Deberíamos consolidar los servicios? ...) puede ayudarlo a obtener respuestas más útiles.
Lilienthal
@Lilienthal Soy el administrador principal de la empresa. Sí, quiero saber si el hardware y la configuración están bien.
Martin Walter
Si la configuración está bien es un tema bastante amplio ya que involucra muchos factores: ¿Tiene una copia de seguridad fuera de línea y / o fuera de sitio? ¿Tienes una estrategia de recuperación? ¿Has probado dicha estrategia de recuperación? ¿Qué tiempo de inactividad puede soportar? ¿Cuál es su presupuesto y nivel de servicio esperado? ¿Cómo es su proceso de actualización y actualización? ¿Están documentados sus sistemas y credenciales? ¿Has considerado factor de autobús? ... Esa es una pregunta bastante diferente de "¿cuándo tiene sentido alejarse del hardware del consumidor?"
Lilienthal
1
@Lilienthal Lol. Me encanta cómo te atrapaste a mitad del párrafo. Sí, eso es lo que quise decir.
Ryan Babchishin

Respuestas:

11

Parece que ya estás usando un hardware decente. ¿Qué tiene de malo? No es demasiado viejo ¿verdad? Mantenga sus cosas en garantía o cerca, si no quiere sentirse demasiado preocupado (no todos comparten mi opinión al respecto).

Si tiene configuraciones configuradas para ser redundantes y buenas copias de seguridad, lo está haciendo bastante bien. Un servidor = punto único de falla, no importa cuán bueno sea, eso me haría sentir incómodo. Hay mucho que puede hacer con un presupuesto al tomar decisiones inteligentes sobre cómo se implementan las cosas software / hardware / infraestructura / soporte inteligente.

Si no tiene precauciones / cosas en su lugar, tal vez debería estar preocupado. Si un sistema muere, ¿se han ido los servicios? ¿Cómo afectará eso a los negocios? ¿Qué tan rápido puedes recuperarte?

Trampas? Depende No proporcionaste demasiada información. Las unidades baratas pueden fallar o ser lentas. Los estuches baratos pueden sobrecalentarse. Los fanáticos baratos pueden fallar. Los controladores SATA / SAS / RAID baratos pueden arruinarse o no funcionar como se espera. Las fuentes de alimentación baratas pueden morir o, si no son redundantes, dejarlo sin energía. Las placas base pueden hacer cosas extrañas. Los sistemas sin consolas remotas (OIT, etc.) pueden ser difíciles de manejar. Las tarjetas de red baratas pueden tener controladores baratos o estropearse. Pueden ocurrir muchos pequeños problemas imprevistos. Por otro lado, puedes obtener cosas de nivel de entrada baratas que funcionan increíblemente. Y las cosas más caras pueden ser inestables a veces también.

Lo he visto todo, en servidores decentes *, servidores de gama baja, estaciones de trabajo y equipos de grado de consumo. Las cosas de mayor nivel parecen mejorar a largo plazo (más allá de la garantía). Pero si no te lo puedes permitir? ¿O solo puede permitirse un servidor y no puede implementar la redundancia adecuada?

No hay nada esencialmente malo con los servidores duales que se ejecutan con Xeon's, memoria ECC y RAID. A menos que tenga un problema con eso.

Ryan Babchishin
fuente
Puede ser útil definir primero los objetivos (cosas que necesita absolutamente, cosas que es agradable tener y cosas que no le molestan mucho) y el presupuesto y luego comprar la mejor calidad que cumpla con esos criterios. Aparte de eso, personalmente ya no tocaría nada sin la administración remota (IPMI, AMT, etc.), es demasiado conveniente. Lo mismo ocurre con las fuentes de alimentación redundantes, especialmente para los hosts de VM donde el apagado consume bastante tiempo.
user121391
9

Suponiendo que sus máquinas virtuales son redundantes (y esto se prueba que funciona con un nodo apagado), es probable que sea relativamente inmune a una interrupción relacionada con el hardware en virtud de tener dos nodos duplicados.

Sin saber más, no recomendaría que se despliegue a un solo cuadro (más nuevo) a menos que una interrupción de todo el nodo no sea un problema importante en su empresa.

Dicho esto, sería útil conocer algunos detalles adicionales sobre su entorno ... como, por cuánto tiempo ha tenido estas máquinas, ¿están en un entorno especialmente diseñado (sala limpia, seca con un estante y aire acondicionado, etc.) . Como probablemente sepa, ¡el equipo bien cuidado dura más!

En términos generales, no hay nada necesariamente malo en usar menos hardware 'profesional', simplemente no viene con las mismas garantías o confiabilidad que el kit más costoso, y estos riesgos deben sopesarse contra su presupuesto.

Matt Renner
fuente
2
Gracias por tu respuesta. Teníamos los servidores durante 3 años, creo. Están en un estante en una habitación dedicada con aire acondicionado. Sin embargo, los servidores no están reflejados. Cada servidor aloja diferentes máquinas virtuales, y cada uno aloja un AD.
Martin Walter
En ese caso (parece que está haciendo un buen trabajo al cuidarlos), entonces creo que es bastante seguro continuar como lo está haciendo ahora (suponiendo que AD es el único servicio crítico que aloja en ellos). Recomiendo implementar algún tipo de monitoreo para estar atento a los errores de hardware (no estoy seguro de qué es lo más apropiado para Windows en estos días) y tal vez planee reemplazarlos o encontrar una solución diferente en los próximos 2-3 años.
Matt Renner
44
@ MartinWalter Quizás deberías estar preocupado. Un sistema muere, sus servicios se han ido. ¿Cómo afectará eso a los negocios? ¿Qué tan rápido puedes recuperarte?
Ryan Babchishin
1
@RyanBabchishin Esa pregunta siempre es importante para la TI interna. Sin embargo, de manera realista siempre hay compensaciones, y para el negocio, bajar durante una o dos horas podría ser aceptable en esa rara ocasión. Además, si OP tiene su VM capturada / exportada a un dispositivo externo, la recuperación es tan simple como montar ese dispositivo externo en el otro cuadro en ejecución y arrancar el VM temporalmente. Para AD, esto probablemente no causará ningún problema (si todo lo que maneja es material básico de AD, nada avanzado) que no sea un rendimiento reducido hasta la recuperación de la máquina principal.
SnakeDoc
1
@SnakeDoc Por eso es una pregunta ... para él. Sobre eso. ?
Ryan Babchishin
5

Dado que su backend de almacenamiento es todo flash, su hardware está totalmente bien para la carga de trabajo mencionada. La única preocupación que tengo con respecto a su configuración es que sus máquinas virtuales están divididas y se ejecutan en un solo servidor en lugar de estar duplicadas / sincronizadas entre servidores, especialmente si son idénticas. Por lo tanto, le recomendaría encarecidamente que utilice un almacenamiento definido por software (SAN virtual) que le permitirá unir ambos servidores en un solo clúster y hacer que sus máquinas virtuales sean inmunes a posibles fallas de hardware.

Las opciones posibles son HP VSA http://www8.hp.com/us/en/products/storage-software/product-detail.html?oid=5306917 o EMC Unity VSA https://store.emc.com/us/ Product-Family / EMC-Unity-Products / EMC-Unity-VSA / p / EMC-Unity-Virtual-Storage-Appliance que es gratuito pero, hasta donde sé, no está permitido para la producción. Dado que está utilizando Hyper-V, una opción perfecta para usted sería utilizar StarWind Virtual SAN https://www.starwindsoftware.com/starwind-virtual-san que se ejecuta de forma nativa en la parte superior de las ventanas y le permite crear sin problemas clúster funcional de Microsoft Failover Hyper-V usando solo almacenamiento conectado directamente.

También recomendaría usar VEEAM B&R https://www.veeam.com/vm-backup-recovery-replication-software.html que tiene una versión gratuita o Bacula http://blog.bacula.org/ para hacer una copia de seguridad de sus máquinas virtuales. de usar Windows 2012 Server Backup nativo, ya que es conocido por causar problemas al intentar recuperar sus máquinas virtuales.

Net Runner
fuente
1
Gracias por el consejo. Sé que la copia de seguridad es algo que debo abordar. La conmutación por error no es posible en este momento, porque las máquinas ejecutan máquinas virtuales diferentes y no tienen tanta RAM, por lo que no puedo poner todas las máquinas virtuales en una sola máquina.
Martin Walter
1
Me encantaría saber más sobre los problemas que ha mencionado sobre la restauración de máquinas virtuales con Windows 2012 Server Backup
wandersick,
1
@wandersick Un problema común en realidad. Windows Backup es conocido por generar errores extraños como 0x8XXXXXXX durante la restauración, lo que hace que la restauración sea imposible. Lo extraño es que a veces hay códigos de error que ni siquiera se pueden buscar en Google :-(
Net Runner
0

En implementaciones pequeñas, generalmente es mejor tener múltiples (al menos 2) máquinas más baratas que una costosa. O, en otras palabras, en implementaciones pequeñas es mejor ser ancho que alto. La razón es que de esta manera tiene algo de redundancia para un aumento limitado en el costo. Es posible que dos servidores 3000 puedan hacer lo mismo que un servidor 5000, pero si el costoso servidor falla, usted está conectado. Si uno de los más baratos falla, al menos tiene la mitad de sus máquinas virtuales en funcionamiento, y probablemente también pueda ejecutar las otras, será lento.

Algo que debe considerar es no administrar estos servidores individualmente, sino agruparlos de alguna manera. Su solución de virtualización debería ser capaz de crear un clúster de conmutación por error para que no importe en qué host viva una VM, si el host muere, la VM se migra automáticamente. Esto también reduce la microgestión y significa que en el futuro, solo puede agregar un nuevo servidor mientras mantiene los antiguos en funcionamiento, hasta que ya no sea económico hacerlo. Esta decisión generalmente se reduce al consumo de energía o limitaciones de espacio.

Si desea crecer más, probablemente quiera migrar del almacenamiento en el servidor a una SAN. De esta manera, sus servidores se convierten en nodos informáticos puros, y su estado de salud realmente no importa a las máquinas virtuales.

mzhaase
fuente
Tenga en cuenta que con esta solución / ruta general, debe alcanzar cierto nivel para que sea correcta. También puede obtener redundancia dentro de la costosa máquina (PSU, discos, controladores, GPU, CPU, tarjetas de red), al tiempo que reduce la complejidad en la administración (actualizaciones de software para el segundo host, orquestación automática de failover de VM, consideraciones de tráfico de red, permisos, monitoreo) un poco. Sin embargo, es difícil decir qué es mejor sin números concretos.
user121391
-8

siempre y cuando no tenga ningún problema en su red y en su sistema de respaldo, puede continuar con esta configuración, pero para el futuro es mejor tener un servidor profesional para estar 100% SALUDABLE.

Shan't Baghdikian
fuente