¿Cómo detectar si un disco está buscando?

16

Puedo usar una variedad de herramientas para medir el volumen de E / S de disco que fluye actualmente a través del sistema (como iotopy iostat), pero tengo curiosidad por saber si es posible detectar fácilmente si un disco está buscando mucho con solo una pequeña cantidad de E / S

Sé que es posible extraer esta información usando blktracey luego decodificarla, bttpero son algo difíciles de manejar y esperaba que hubiera una alternativa más simple.

Gearoid Murphy
fuente
44
¿Poner la oreja cerca de tu disco? :)
terdon
2
¿No debería una relación baja (rkB/s + wkB/s)/%utilsignificar que el disco está buscando (in iostat -x)?
Marco
1
¿Desea una herramienta que muestre esto en vivo o desea ver los datos durante un período de tiempo determinado?
slm
1
AFAIK, kernel.org/doc/Documentation/iostats.txt son las únicas estadísticas que mantiene el kernel, por lo que no espero que encuentres algo mejor que blktrace.
Stéphane Chazelas

Respuestas:

4

La relación (rkB/s + wkB/s)/%utilde la iostat -xsalida debería darle una idea:

Device:  rrqm/s wrqm/s   r/s   w/s  rkB/s  wkB/s avgrq-sz avgqu-sz await r_await w_await  svctm  %util
sda        0.04   3.65  7.16  6.37 150.82 212.38    53.71     0.03  1.99    0.82    3.31   0.76   1.03

No estoy seguro de cómo exactamente esta relación corresponde a la búsqueda de disco. Pero la idea es que, si el disco está ocupado y no tiene un alto rendimiento, probablemente esté buscando. Sin embargo, no está garantizado. Los discos rotos a veces muestran una alta utilización y casi no tienen rendimiento. Pero es al menos un indicador.

También puede proporcionar un número a iostat (por ejemplo iostat -x 5) para especificar el intervalo de actualización. De esa manera puede monitorear continuamente.

Marco
fuente
Presumiblemente, muchas solicitudes de lectura combinadas con un bajo rkB / s serían indicativas de tal situación
Gearoid Murphy
8

No estoy seguro si está buscando herramientas que muestren este tipo de información en forma de tiempo real o durante un período de tiempo, pero aquí hay 2 herramientas que muestran los aspectos en tiempo real del disco al que se accede.

nmon

Se invoca como tal, nmon. Luego, una vez que está abierto, presiona el j(Sistemas de archivos) seguido de un d(Gráficos de E / S de disco D = Estadísticas). Consulte la ayuda integrada ( h) para obtener más detalles.

$ nmon
┌nmon─13g─────────────────────Hostname=manny────────Refresh= 2secs ───11:15.32─────────────────────────────────────────────────────┐
│ Filesystems ─────────────────────────────────────────────────────────────────────────────────────────────────────────────────────│
│Filesystem            SizeMB  FreeMB %Used Type     MountPoint                                                                    │
│v/mapper/ubuntu-root 465389.0 457483.9   1.7 ext4     /                                                                           │
│/proc                                      proc     not a real filesystem                                                         │
│/sys                                       sysfs    not a real filesystem                                                         │
│/sys/fs/fuse/connections                   fusectl  not a real filesystem                                                         │
│/sys/kernel/debug                          debugfs  not mounted                                                                   │
│/sys/kernel/security                       security not a real filesystem                                                         │
│/dev                                       devtmpfs not a real filesystem                                                         │
│/dev/pts                                   devpts   not a real filesystem                                                         │
│tmpfs                  740.5   739.4   0.1 tmpfs    /run                                                                          │
│none                     5.0     5.0   0.0 tmpfs    /run/lock                                                                     │
│none                  1851.2  1849.8   0.1 tmpfs    /run/shm                                                                      │
│none                   100.0    99.9   0.1 tmpfs    /run/user                                                                     │
│/dev/sda1              910.9   606.5  33.4 ext2     /boot                                                                         │
│/run/rpc_pipefs                            rpc_pipe fstatfs returned zero blocks!!                                                │
│/run/user/emma/gvfs                        fuse.gvf not mounted                                                                   │
│/run/user/emily/gvfs                       fuse.gvf not mounted                                                                   │
│ Disk I/O ──/proc/diskstats────mostly in KB/s─────Warning:contains duplicates─────────────────────────────────────────────────────│
│DiskName Busy  Read WriteMB|0          |25         |50          |75       100|                                                    │
│sda      100%    0.0   66.4|RWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWW>                                                    │
│sda1       0%    0.0    0.0|>                                                |                                                    │
│sda2       0%    0.0    0.0|>                                                |                                                    │
│sda5     100%    0.0   66.4|RWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWW>                                                    │
│dm-0     100%    0.0   48.0|RWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWW>                                                    │
│dm-1       0%    0.0    0.0|                     >                           |                                                    │
│Totals Read-MB/s=0.0      Writes-MB/s=180.9    Transfers/sec=363.2                                                                │
│──────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────│

Otra herramienta que he encontrado que hace al menos una vista en vivo de la E / S de disco es atop.

$ atop
ATOP - grinchy                           2013/08/23  11:10:58                           ------                           10s elapsed
PRC | sys    2.18s  | user  26.26s  | #proc    315  | #trun  5 |  #tslpi   764 |  #tslpu     1 |  #zombie    0 |  #exit  1 |
CPU | sys      22%  | user    264%  | irq       0%  | idle    110% |  wait      4% |  guest     0% |  curf 1.20GHz |  curscal  44% |
cpu | sys       5%  | user     76%  | irq       0%  | idle     19% |  cpu003 w  0% |  guest     0% |  curf 1.20GHz |  curscal  44% |
cpu | sys       5%  | user     67%  | irq       0%  | idle     26% |  cpu001 w  2% |  guest     0% |  curf 1.20GHz |  curscal  44% |
cpu | sys       5%  | user     62%  | irq       0%  | idle     31% |  cpu000 w  1% |  guest     0% |  curf 1.20GHz |  curscal  44% |
cpu | sys   7%  | user     58%  | irq   0%  | idle     34% |  cpu002 w  1% |  guest     0% |  curf 1.20GHz |  curscal  44% |
CPL | avg1    3.83  | avg5    4.59  | avg15   4.76  |              |  csw    54101 |  intr   45315 |               |  numcpu     4 |
MEM | tot     7.6G  | free  194.3M  | cache 495.5M  | dirty   2.7M |  buff   38.9M |  slab   86.7M |               |               |
SWP | tot     5.7G  | free    5.5G  |               |              |               |               |  vmcom  12.4G |  vmlim   9.5G |
LVM | nchy-lv_home  | busy     11%  | read       1  | write    524 |  KiB/w      3 |  MBr/s   0.00 |  MBw/s   0.20 |  avio 2.05 ms |
LVM | nchy-lv_root  | busy      1%  | read       0  | write      7 |  KiB/w  4 |  MBr/s   0.00 |  MBw/s   0.00 |  avio 9.00 ms |
DSK |          sda  | busy     11%  | read       1  | write    109 |  KiB/w 19 |  MBr/s   0.00 |  MBw/s   0.20 |  avio 10.3 ms |
NET | transport     | tcpi  72  | tcpo     118  | udpi      15 |  udpo   5 |  tcpao     11 |  tcppo      0 |  tcprs      0 |
NET | network       | ipi       87  | ipo      123  | ipfrw      0 |  deliv     87 |               |  icmpi      0 |  icmpo      0 |
NET | wlan0   ----  | pcki      88  | pcko     123  | si   34 Kbps |  so   19 Kbps |  erri       0 |  erro       0 |  drpo       0 |

  PID  RUID       EUID       THR    SYSCPU    USRCPU   VGROW    RGROW    RDDSK   WRDSK   ST   EXC  S   CPUNR    CPU  CMD         1/4
 3649  saml       saml        34     0.33s    11.98s      0K    1752K       4K   2828K   --     -  R       2   122%  chrome
10399  saml       saml         4     0.14s     3.08s   5120K   -12.8M       0K      0K   --     -  S       2    32%  chrome

Específicamente estas líneas que muestran actividad LVM y DSK:

    LVM | nchy-lv_home  | busy     11%  | read       1  | write    524 |  KiB/w      3 |  MBr/s   0.00 |  MBw/s   0.20 |  avio 2.05 ms |
    LVM | nchy-lv_root  | busy      1%  | read       0  | write      7 |  KiB/w  4 |  MBr/s   0.00 |  MBw/s   0.00 |  avio 9.00 ms |
    DSK |          sda  | busy     11%  | read       1  | write    109 |  KiB/w 19 |  MBr/s   0.00 |  MBw/s   0.20 |  avio 10.3 ms |

iostat

Si está interesado en los datos durante un período de tiempo, iostatsigue siendo probablemente su mejor opción, envuelta en un script. Puede deshacerse de la salida de utilización para que sea más fácil tratar con:

$ iostat -dx /dev/sda 5
Linux 2.6.35.14-106.fc14.x86_64 (grinchy)   08/23/2013  _x86_64_    (4 CPU)

Device:         rrqm/s   wrqm/s     r/s     w/s   rsec/s   wsec/s avgrq-sz avgqu-sz   await  svctm  %util
sda               1.82    96.60    3.84   20.68   122.26   891.99    41.36     0.46   18.77   7.35  18.01

Device:         rrqm/s   wrqm/s     r/s     w/s   rsec/s   wsec/s avgrq-sz avgqu-sz   await  svctm  %util
sda               0.00    26.20    1.60   24.60    17.60   350.40    14.05     0.31   11.95   8.84  23.16

Directamente desde el núcleo

Este bloque de código (bash) le mostrará las E / S de lectura procesadas, directamente desde el Kernel.

OLD=`awk '{print $1}' /sys/block/sda/stat` # First field is number of read I/Os processed
DT=1
for ii in `seq 1 10`
do
    sleep $DT
    NEW=`awk '{print $1}' /sys/block/sda/stat`
    echo $((($NEW-$OLD)/$DT))
    OLD=$NEW
done

fuente: /server//a/525248/2518

La información también se puede obtener de cualquiera /sys/block/sda/stato /proc/diskstatsen situaciones en las que no puede o no desea instalar ninguna herramienta.

Referencias

slm
fuente
Gracias por la respuesta detallada, pero las métricas que ha proporcionado todavía están enfocadas en E / S, idealmente, me gustaría ver la actividad de búsqueda de disco independientemente del rendimiento de E / S
Gearoid Murphy
@GearoidMurphy: no encontré una forma de obtener este tipo de datos de telemetría sobre los accesos a disco fuera de E / S.
slm
Creo que Marco lo golpeó en un comentario anterior, la solución sería mirar la relación de las transacciones de disco al volumen real de datos leídos / escritos.
Gearoid Murphy
1
@GearoidMurphy: sí, es por eso que solicité aclaraciones en los comentarios sobre si deseaba un tipo de solución en tiempo real o un tipo de período. Si se te ocurre una solución viable, la escribiré como respuesta y la aceptaré. No hubo mucho al buscar su inclinación particular en esto.
slm