En los enrutadores de borde de Internet que hablan eBGP a múltiples operadores e iBGP entre sí, todas las interfaces en el lado LAN y WAN son GE, excepto un Serial full-DS3 (~ 45Mbps) en cada enrutador. Aunque creo que apenas envío mucho tráfico saliente en las interfaces seriales, en el rango de 3-10 Mbps, veo caídas de cola de salida constantes (OQD). ¿Es la explicación probable de que realmente hay tráfico en ráfagas que no estoy viendo ya que el intervalo de carga está en el mínimo de 30 segundos y el sondeo SNMP está promediando el tráfico durante 5 minutos, por lo que esos no iluminarán el estallido?
La plataforma es un Cisco 7204VXR NPE-G2. La cola en serie es de quince .
Serial1 / 0 está activo, el protocolo de línea está activo El hardware es M2T-T3 + pa Descripción: -removed- La dirección de Internet es abcd / 30 MTU 4470 bytes, BW 44210 Kbit, DLY 200 usec, fiabilidad 255/255, txload 5/255, rxload 1/255 Encapsulación HDLC, crc 16, loopback no establecido Conjunto Keepalive (10 segundos) El retraso de reinicio es de 0 segundos Última entrada 00:00:02, salida 00:00:00, salida bloqueada nunca Última eliminación de los contadores de "show interface" 00:35:19 Cola de entrada: 0/75/0/0 (tamaño / máx. / Gotas / descargas); La producción total cae: 36 Estrategia de colas: fifo Cola de salida: 0/40 (tamaño / máx.) Velocidad de entrada de 30 segundos 260000 bits / seg, 208 paquetes / seg. Velocidad de salida de 30 segundos 939000 bits / seg., 288 paquetes / seg. 410638 paquetes de entrada, 52410388 bytes, 0 sin búfer Recibió 212 transmisiones, 0 runas, 0 gigantes, 0 aceleradores 0 paridad 0 errores de entrada, 0 CRC, 0 trama, 0 desbordamiento, 0 ignorado, 0 aborto Salida de paquetes 515752, 139195019 bytes, 0 subestimaciones 0 errores de salida, 0 apliques, 0 restablecimientos de interfaz 0 fallas del búfer de salida, 0 búferes de salida intercambiados 0 transiciones de portadora rxLOS inactivo, rxLOF inactivo, rxAIS inactivo txAIS inactivo, rxRAI inactivo, txRAI inactivo
24 horas después mostrará miles de OQD. Impulsamos más tráfico alrededor de las 3 de la madrugada cada día, por lo que tal vez haya un poco de tráfico con ráfagas aquí al que no le estoy dando suficiente peso.
Last clearing of "show interface" counters 1d01h
Input queue: 0/75/0/158 (size/max/drops/flushes); Total output drops: 12049
Me gustaría impulsar más tráfico saliente en el DS3, pero no con mi preocupación en el OQD. El ISP de nivel 2 detrás del DS3 tiene POP que se duplican como puntos de interconexión con más de 6 niveles 1, por lo que la idea es obtener ese tráfico en la red con el cliente lo antes posible en comparación con nuestro ISP principal en el GE que es un nivel 1 , pero deben abrirse camino hacia sus intercambios entre pares. El tráfico entrante no es una preocupación.
¿Hay una mejor estrategia de cola que Fifo en esta situación? Mirando los documentos de Cisco sobre las caídas de la cola de entrada y salida, no se recomienda incrementar el tamaño de la cola de salida ya que los paquetes ya están en el enrutador y sería mejor soltar en la entrada para que TCP pueda acelerar la aplicación. Hay mucho ancho de banda en nuestros enlaces GE, por lo que no hay necesidad de limitar la entrada. No hay mapas de políticas en estos enrutadores. El 90% del tráfico saliente proviene de nuestras respuestas HTTP; La mayoría del resto de FTP y SMTP. Los enlaces de GE empujan 50-200 + Mbps.
¿Recomendaría algún ajuste en el búfer de tamaño de la cola de salida? Estas interfaces seriales son nuestros enlaces de respaldo que preferiría utilizar más por la razón dada anteriormente (si es válida), pero moderadas con mis políticas BGP que intentan no sobrecargar esa interfaz serial (que parece muy poco cargada la mayor parte del tiempo).
Los OQD generalmente son causados por una de dos cosas:
Estás sobreutilizando el enlace; ya sea con alto uso constante o tráfico explosivo.
Tiene un mapa de políticas aplicado a la interfaz que está configurado para hacer algo como vigilar o dar forma a parte o todo el tráfico
Hay algún tipo de error en la interfaz, eche un vistazo a los contadores de errores (
show interface Serial1/0 counters errors
) y verifique que no se caigan los paquetes debido a un error.Podrías investigar (si aún no tienes uno) establecer un mapa de políticas para hacer cosas como darle a tu tráfico de misión crítica su propia cola, evitar la congestión en el tráfico regular (WRED) o incluso habilitar la cola justa en el tráfico para que el ancho de banda se comparte entre los flujos que transitan por la interfaz.
Como ha mencionado, otra opción sería aumentar el tamaño de la cola de salida en la interfaz, pero si fuera a utilizar un mapa de políticas, no habría necesidad de hacerlo de todos modos, ya que la política crearía otras subcolas.
fuente