Utilizo las pruebas de Debian sin ningún problema durante ~ 6 años (solo las estoy actualizando regularmente), pero recientemente comenzó a mostrar un comportamiento aleatorio que puede resumirse como "Bajo rendimiento de E / S que persiste hasta el reinicio".
El problema es que, de repente, todas las lecturas y escrituras de disco se ralentizan a ~ 5 MB / seg, lo que resulta en lecturas y escrituras continuas. Dado que la tasa es tan baja, los discos no se ven desafiados o estresados mecánicamente, pero todo se ralentiza hasta que reinicio.
El subsistema de E / S de la computadora consta de un SSD OCZ Vertex 3 y dos HDD WD Caviar Black. SSD contiene una parte del sistema operativo con mucha lectura y una partición en el HDD contiene el resto.
Para diagnosticar el problema probé lo siguiente sin éxito:
top
no muestra ninguna actividad fuera de control ni en el uso de CPU o E / S.hdparm
devuelve clasificaciones de rendimiento normales de los discos (aunque solo lo verifiqué-t
).smartctl
no muestra ningún problema de rendimiento en los discos. Largas pruebas mostraron que los discos son tan buenos como nuevos.
El sistema tiene un chipset Z77, 16 GB de RAM e CPU Intel i7 3770K y las estadísticas no muestran signos de saturación en RAM, E / S o CPU, pero no tengo experiencia para depurar problemas como este (especialmente en el espacio del kernel). Cualquier ayuda será apreciada.
Actualización 1:
- Corrí (forzado) fsck en cada partición como medida de precaución. Todos los FS están limpios.
- Por cierto, encontré una actualización de BIOS que salió hace un mes y la apliqué.
- Ninguna partición se llena más del 50%.
Actualización 2:
El problema no está surgiendo durante dos días. O fsck
la actualización del BIOS limpió algunas obstrucciones en el sistema. Todavía estoy monitoreando el problema y cerraré la pregunta con una respuesta post mortem.
Actualización 3:
El problema simplemente resurgió y cavé un poco más. Por favor mira la respuesta.
fuente
atop
le indicaría qué tan ocupados están los discos (como cuando se busca todo el tiempo).noop
.free
)iowait
etc., si está recopilando datos sar. Lo habilitaríasysstat
si aún no se está ejecutando. Puede verificar con lasar -A
mayoría de las plataformas tener intervalos de muestra de diez minutos.Respuestas:
Logré reproducir el problema nuevamente y fue el resultado de un gran caché de disco. Mis cachés de disco pueden crecer más de 8 GB y parece que a algunas aplicaciones no les gusta y la E / S sufre.
Soltar cachés de disco
echo 3 > /proc/sys/vm/drop_caches
como raíz soluciona el problema. Actualmente no sé por qué los cachés de disco grandes causan esta degradación de E / S.Última actualización: después de más investigaciones, descubrí que la cantidad de archivos en la caché estaba provocando el problema. Estaba destrozando los discos mientras intentaba confirmar muchos archivos pequeños en el disco. Desde que utilicé el sistema durante diez años, me decidí y reinstalé con Debian de 64 bits. Ahora está funcionando sin problemas. Probablemente fue un efecto secundario de diez años de actualización al encontrar límites del sistema operativo de 32 bits.
fuente
¿Hay algún mensaje sospechoso en
dmesg
?Algunas herramientas más que podría tratar de obtener algunos conocimientos sobre los cuellos de botella de su sistema:
fuente