¿Por qué las grandes instalaciones de Exchange requieren tiempo de inactividad para el mantenimiento?

8

He utilizado varios proveedores externos de Exchange de primer nivel a lo largo de los años, y todos ellos han tenido tiempos de inactividad programados regularmente para el mantenimiento de rutina (aproximadamente una vez al mes). Me pregunto qué tiene Exchange que hace que sea imposible evitar tiempos de inactividad de esta naturaleza. ¿Es realmente imposible mantener un tiempo de actividad 24x7 o simplemente costoso y por qué?

Michael Teper
fuente
2
OMI, la forma en que se hace esta pregunta lo hace fuera de tema para serverfault. Este sitio es para sistemas que administra, no preguntas sobre cómo los proveedores de alojamiento han configurado su sistema. Una pregunta como '¿Cómo configuro el intercambio para no tener interrupciones de mantenimiento?' Hubiera estado bien.
Zoredache
@Zoredache Después de haber utilizado tres servidores de Exchange diferentes durante un período de tiempo significativo (más de un año), y de que los tres realicen un mantenimiento programado regular, me sentí seguro asumiendo que configurar una instalación de Exchange sin interrupciones no es práctico. Quería saber por qué. @Zippy parece tener la respuesta.
Michael Teper
Estoy de acuerdo con Zoredache, esta es una pregunta para el usuario final. También es completamente subjetivo, aunque la respuesta breve debe ser: la misma razón por la que todos los sistemas Windows se desconectan por mantenimiento (por ejemplo, parches, actualizaciones, etc.)
John Gardeniers
Los sistemas Linux también necesitan parches y actualizaciones.
ceejayoz

Respuestas:

7

Las actualizaciones de Windows y Exchange siempre requieren reinicios para finalizar la instalación, así que eso es parte de ello. Con una buena planificación y una configuración adecuada (equilibradores de carga y agrupación) puede mantener un tiempo de actividad 24x7 para que el correo electrónico esté siempre disponible en un servidor.

Sin embargo, en el lado del cliente, siempre hay una breve interrupción (5-30 segundos) ya que Outlook descubre que el servidor CAS al que está conectado está desconectado y la detección automática lo cambia a otro. Por lo general, aparece el mensaje "El administrador de Exchange ha realizado un cambio que requiere que reinicie Outlook" cuando esto sucede.

No es una interrupción prolongada, pero cuenta como una interrupción, por eso debe programar el tiempo de mantenimiento para hacerlo. También existe la posibilidad de que algo salga mal durante el período de mantenimiento, por lo que para CYA debe programarlo.

EDITAR: Entonces descubrí que si coloca un equilibrador de carga frente a sus servidores CAS, no recibirá el mensaje "El administrador de Exchange ha realizado un cambio ..." en Outlook. Aún tendrá una breve interrupción cuando el equilibrador de carga lo cambie a un servidor CAS activo.

enérgico
fuente
no hay ninguna razón por la cual un cambio de servidor requiera que los clientes reinicien su software (esto es tan ridículo como requerir que los usuarios reinicien IE / Firefox si se reinicia un servidor web), esto es solo una falla en el propio Exchange.
Lie Ryan
Esto suena como la respuesta más plausible hasta ahora, pero se contradice directamente con la respuesta de @ Massimo. Estoy un poco perdido en cuanto a cómo decidir cuál otorgar la respuesta. Sugerencias?
Michael Teper
Yo votaría por la respuesta de Zippy sobre la de Massimo. Siempre tendrá ese breve período de transición cuando no se pueda acceder al correo, incluso con dos servidores y almacenamiento compartido. El modo en caché en el cliente puede hacer que sea menos obvio cuando esto sucede, pero realmente no quisiera que dos servidores accedan al mismo almacén de respaldo al mismo tiempo.
Robert Novak
9

Larga historia corta ... No estás utilizando ese gran proveedor.

No hay ninguna razón por la que necesite programar el tiempo de inactividad regular de un entorno de Exchange (aunque programar ventanas de mantenimiento regulares siempre es una buena idea). Especialmente con Exchange 2010. Siempre que su redundancia se planifique e implemente correctamente, todo fluirá. Red redundante, almacenamiento redundante, servidores redundantes.

Probablemente no obtendrá esto utilizando un proveedor de $ 3 / mes. No revendo buzones de Exchange de $ 3 / mes. La mayoría de mis razones para recomendar un acuerdo alojado de Exchange con la importancia del correo electrónico y el tiempo de actividad. Tiene que pagar más por un proveedor que no baja todo el tiempo, pero el retorno de la inversión tiene sentido.

Nuestro proveedor envía correos electrónicos para cada mantenimiento programado. Recibimos al menos uno de ellos al mes. El 99% de ellos básicamente lee: "Estamos haciendo mantenimiento en nuestros servidores entre las 2 a.m. y las 2:15 a.m.

Si está buscando un tiempo de actividad del 100% sin 30 segundos de conmutación por error, simplemente no lo encontrará en ninguna parte. No con Exchange, ni con Google Apps, ni con Domino. El 100% de tiempo de actividad no existe. Siempre se necesitarán ventanas de mantenimiento y las failovers aún requieren tiempo (incluso si ese tiempo es breve).

Por lo tanto, busque un nuevo proveedor que le cueste más pero que le brinde el tiempo de actividad que necesita.

Jason Berg
fuente
2
@ Jason Lo siento, pero tu respuesta es una contradicción. Primero dice que no se requiere tiempo de inactividad regular y luego dice que sí, y nadie puede evitarlo. Usted cita a Google como un contraejemplo de Exchange, sin embargo, nunca he recibido un aviso de tiempo de inactividad para GMail o Google Apps. También, incorrectamente, asume que he usado proveedores de Exchange de nivel inferior. De hecho, no lo he hecho, y he estado pagando mucho más de $ 3 / buzón / mes.
Michael Teper
2
Probablemente no recibirá avisos de tiempo de inactividad de las aplicaciones de gmail o google, pero eso no significa que no sufrirá una degradación grave de vez en cuando (3-4 veces en el último mes para mis dominios).
Robert Novak
1
Y Jason no se está contradiciendo a sí mismo. Las ventanas de mantenimiento programado (plazos predecibles para el mantenimiento planificado, cuando sea necesario) son una muy buena práctica. El tiempo de inactividad programado (interrupciones previsibles / garantizadas) no sería. ¿Ver la diferencia?
Robert Novak
3
but your answer is a contradition. First you say that regular downtime is not required and then you say that it is. En realidad, no se requiere tiempo de inactividad real, pero puede haber un corto período de tiempo en el que se produce la conmutación por error. No llamaría a un servidor 'inactivo' durante la ventana de conmutación por error. Se deben mantener los sistemas individuales, pero la instalación completa de Exchange no debería tener que fallar si gasta mucho $$$ para configurarlo correctamente.
Zoredache
¿Cómo es imposible el 100% de tiempo de actividad? ¿No podría simplemente tener algunos servidores con registros MX de menor prioridad que contienen correo mientras los servidores principales están inactivos?
Daniel Lo Nigro
7

Mantenga la redundancia N + 1 para literalmente cada parte de la red para garantizar que ningún tiempo de inactividad por mantenimiento costará más; suficiente más que el servicio ya no sería competitivo en precio. La mayoría de las empresas son muy tolerantes con un tiempo de inactividad mínimo programado. Esto no es exclusivo de Exchange, casi todos los proveedores de hosting, de cualquier tipo, con los que he tratado hace aproximadamente lo mismo.

En el caso de Exchange, se reducirá una vez al mes (al menos) para Patch Tuesday.

Chris S
fuente
66
Todos quieren un tiempo de actividad del 100%, pero muy pocos están dispuestos o son capaces de pagarlo. Para los servidores de correo electrónico, creo que la mayoría de las personas están bien con un 99% de tiempo de actividad.
Zippy
1
Mantener la redundancia N + 1 es de bajo costo para un gran valor de N, el OP está interesado en una instalación de Exchange grande que debería poder permitirse una redundancia N + 1.
Lie Ryan
@Lie Ryan: el costo por usuario puede ser menor en grandes bases de instalación, pero no es gratis. Si las personas se enfrentan a un hosting de intercambio por $ 10 al mes y un hosting de intercambio por $ 5 al mes, ¿cuántos elegirán el plan de menor costo y se quejarán de su tiempo de inactividad y nunca se darán cuenta de que el host de $ 10 por mes tiene 3 veces la disponibilidad del host de $ 5 y es por eso que cuesta mas?
Rob Moir
5

El único mantenimiento de rutina que Exchange necesita es parchear los servidores, lo que en un entorno construido adecuadamente no debería crear ningún tiempo de inactividad: incluso con solo dos servidores, puede mantener uno de ellos activo mientras parchea y reinicia el otro. Tomar copias de seguridad no crea ningún tiempo de inactividad, y probar las restauraciones es algo que debe hacerse en un entorno DR, no en servidores en vivo. Realmente no entiendo qué es este "mantenimiento de rutina" o por qué debería ser necesario.

Por supuesto, no digo que garantizar un 99% de tiempo de actividad sea fácil; los problemas suceden, incluso en los mejores y más caros entornos. Lo que digo es que no hay ninguna razón para eliminar un sistema de Exchange para el "mantenimiento de rutina". A menos que realice desfragmentaciones rutinarias fuera de línea de sus bases de datos ... algo que nadie en su sano juicio ya debería estar haciendo (pero aún así ...).

Massimo
fuente
0

No hay nada en Exchange que lo haga inherentemente poco confiable o propenso a caer ... de hecho, diría que se aplica lo contrario. Depende de cómo estén configurados los proveedores para proporcionar su servicio de Exchange .

Uno o más servidores pueden proporcionar un servicio : los principales sitios web, sistemas de correo electrónico (por ejemplo, gmail, hotmail, etc.) son proporcionados por grupos de servidores diseñados para permitir que algunos de los servidores que alojan el servicio estén fuera de línea sin afectar la disponibilidad del servicio

Si los servidores que brindan el servicio se basan en un sistema que admite alta disponibilidad (por ejemplo, agrupación en clúster), entonces es posible que algunos de los servidores que brindan el servicio estén desconectados sin desconectarlo.

Esa es la teoría ... y se puede hacer que la teoría funcione en la práctica. La pregunta es cuánto está dispuesto a gastar el proveedor en hardware, diseño de sistemas y soporte (el costo de pasar del 99.99% disponible al 99.999% disponible es mucho mayor que el costo de pasar del 99% al 99.9% disponible, por ejemplo) . En el caso de un servicio alojado, esto se convierte rápidamente en una cuestión de cuánto están preparadas las personas para pagar por el servicio.

Para un proveedor, esto puede convertirse rápidamente en un costo prohibitivo, y cuando se dispara por una disponibilidad muy alta, incluso cantidades muy pequeñas de tiempo de inactividad pueden afectar sus estadísticas .

Rob Moir
fuente