¿A dónde se fue mi RAM?

15

Nota: antes de saltar demasiado rápido, ¡sí, leí linuxatemyram.com !

Tengo un servidor con 64 GB de RAM.

free -m dice que mi RAM está llena, y no es por el almacenamiento en caché del disco:

             total       used       free     shared    buffers     cached
Mem:         64458      64117        340        201         67        331
-/+ buffers/cache:      63719        739
Swap:         1532        383       1149

Sin embargo, topordenado por uso de memoria no agrega hasta 64 GB:

KiB Mem:  66005116 total, 65652464 used,   352652 free,    67512 buffers
KiB Swap:  1569780 total,   392656 used,  1177124 free.   337464 cached Mem

  PID USER      PR  NI    VIRT    RES    SHR S  %CPU %MEM     TIME+ COMMAND
 6258 mysql     20   0 38.665g 0.033t   4924 S   1.3 54.3 482:26.21 mysqld
 2293 root      20   0  165896 102116 101964 S   0.0  0.2   0:43.53 systemd-journal
 4909 root      20   0  377548  57840  57548 S   0.0  0.1   0:18.47 rsyslogd
26639 www       20   0  650076  53348  32968 S   0.0  0.1  11:32.27 php-fpm
26640 www       20   0  648344  51912  32984 S   0.0  0.1  11:37.43 php-fpm
26642 www       20   0  648600  51472  32580 S   0.0  0.1  11:37.16 php-fpm
26669 www       20   0  648148  50696  31988 S   0.0  0.1  11:35.24 php-fpm
26643 www       20   0  648452  50616  31628 S   0.0  0.1  11:36.19 php-fpm
26641 www       20   0  648620  50496  31340 S   0.0  0.1  11:36.51 php-fpm
28121 www       20   0  648620  48820  29660 S   0.0  0.1  11:35.75 php-fpm
27231 www       20   0  647508  48804  30760 S   0.0  0.1  11:35.61 php-fpm
28029 www       20   0  648044  48752  30172 S   0.0  0.1  11:37.20 php-fpm
28117 www       20   0  647868  48700  30296 S   0.0  0.1  11:36.45 php-fpm
28122 www       20   0  648340  48568  29676 S   0.0  0.1  11:35.73 php-fpm
 8569 www       20   0  649028  40268  20704 S   0.0  0.1  11:31.50 php-fpm
10126 www       20   0  648432  39420  20700 S   0.0  0.1   9:58.52 php-fpm
22386 www       20   0  647996  39400  20868 S   0.0  0.1  11:25.00 php-fpm
 9643 www       20   0  647976  39220  20704 S   0.0  0.1  11:29.23 php-fpm
23077 www       20   0  647852  39084  20692 S   0.0  0.1  11:11.80 php-fpm
10139 www       20   0  647580  38808  20692 S   0.0  0.1   9:59.94 php-fpm
 6326 www       20   0  647368  38396  20696 S   0.7  0.1   8:32.34 php-fpm
 4727 www       20   0  646128  37304  20692 S   0.0  0.1   8:30.20 php-fpm
 5459 www       20   0  645988  37156  20688 S   0.0  0.1   7:15.13 php-fpm
 2173 www       20   0  645240  36408  20684 S   0.0  0.1   4:39.13 php-fpm
20752 www       20   0  644536  35428  20680 S   0.0  0.1   4:29.78 php-fpm
 5396 www       20   0  644468  35324  20692 S   0.0  0.1   4:14.65 php-fpm
17558 www       20   0  642668  33816  20740 S   0.0  0.1   1:28.34 php-fpm
28133 www       20   0  642780  33636  20704 S   0.0  0.1   0:49.88 php-fpm
10925 www       20   0  479584  29264  11212 S   3.0  0.0   0:00.09 php
26632 root      20   0  552136  26072  19468 S   0.0  0.0   0:37.74 php-fpm
 4946 named     20   0  697996  18748   2104 S   0.0  0.0   3:46.96 named
15609 apache    20   0 2137056   8120   1592 S   0.0  0.0   0:56.18 httpd
 8584 root      20   0  133432   4864   3700 S   0.0  0.0   0:00.08 sshd

MySQL usa solo 54.3%, esto es perfectamente normal ya que tiene una innodb_buffer_pool_sizede 32G. El uso de memoria de los otros procesos suma aproximadamente un 2.8%, es decir, un total de 57.1%.

¿Dónde queda el 32% restante?


Editar: contenido de /proc/meminfo:

MemTotal:       66005116 kB
MemFree:          353272 kB
Buffers:           66328 kB
Cached:           736620 kB
SwapCached:        11348 kB
Active:         34396680 kB
Inactive:        2651132 kB
Active(anon):   34223240 kB
Inactive(anon):  2228020 kB
Active(file):     173440 kB
Inactive(file):   423112 kB
Unevictable:           0 kB
Mlocked:               0 kB
SwapTotal:       1569780 kB
SwapFree:        1177448 kB
Dirty:               328 kB
Writeback:             0 kB
AnonPages:      36234364 kB
Mapped:           125208 kB
Shmem:            206396 kB
Slab:           28058904 kB
SReclaimable:   28010224 kB
SUnreclaim:        48680 kB
KernelStack:        2760 kB
PageTables:        94780 kB
NFS_Unstable:          0 kB
Bounce:                0 kB
WritebackTmp:          0 kB
CommitLimit:    34572336 kB
Committed_AS:   38572348 kB
VmallocTotal:   34359738367 kB
VmallocUsed:      382304 kB
VmallocChunk:   34359353572 kB
HardwareCorrupted:     0 kB
DirectMap4k:        9000 kB
DirectMap2M:     2054144 kB
DirectMap1G:    67108864 kB

Salida de slabtop:

 Active / Total Objects (% used)    : 147380425 / 147413026 (100.0%)
 Active / Total Slabs (% used)      : 7005839 / 7005839 (100.0%)
 Active / Total Caches (% used)     : 71 / 144 (49.3%)
 Active / Total Size (% used)       : 27615020.12K / 27627490.91K (100.0%)
 Minimum / Average / Maximum Object : 0.01K / 0.19K / 16.12K

  OBJS ACTIVE  USE OBJ SIZE  SLABS OBJ/SLAB CACHE SIZE NAME
146851887 146851887  12%    0.19K 6992947       21  27971788K dentry
124936 124936 100%    0.07K   2231       56      8924K Acpi-ParseExt
105144 105144 100%    0.10K   2696       39     10784K buffer_head
 49920  49172  98%    0.06K    780       64      3120K kmalloc-64
 29916  29916 100%    0.11K    831       36      3324K sysfs_dir_cache
 29856  29661  99%    0.12K    933       32      3732K kmalloc-128
 21450  21128  98%    0.18K    975       22      3900K vm_area_struct
 19328  19328 100%    0.03K    151      128       604K kmalloc-32
 18258  13383  73%    0.93K    537       34     17184K ext4_inode_cache
 17952  11651  64%    0.04K    176      102       704K ext4_extent_status
 16828   6513  38%    0.55K    601       28      9616K radix_tree_node
 14400  13996  97%    0.06K    225       64       900K anon_vma
 11645   7903  67%    0.05K    137       85       548K shared_policy_node
 10710   7006  65%    0.19K    510       21      2040K kmalloc-192
 10608  10608 100%    0.04K    104      102       416K Acpi-Namespace
  9728   9728 100%    0.01K     19      512        76K kmalloc-8
...
Benjamín
fuente
3
lea linuxatemyram.com nuevamente. Luego lea kernel.org/doc/gorman/html/understand
symcbean
Lo leí de nuevo, y termina sugiriendo que ese free -mes el camino a seguir para obtener realmente el uso de la memoria. Además, el hecho de que el uso de intercambio no sea 0 me hizo dudar un poco. Revisé su enlace, pero hay tantos datos para leer que no puedo manejar todo esto en este momento, me temo.
Benjamin
¿Es este un servidor físico?
Optichip
@Optichip Es un servidor físico.
Benjamin
55
@ AndrewSchulman No creo que esta sea una pregunta es un duplicado de esa pregunta en particular. Esta pregunta es sobre la memoria utilizada para losas. La otra pregunta no menciona las losas en absoluto.
Kasperd

Respuestas:

23
  OBJS ACTIVE  USE OBJ SIZE  SLABS OBJ/SLAB CACHE SIZE NAME
146851887 146851887  12%    0.19K 6992947       21  27971788K dentry

Dices que no se debe al almacenamiento en caché del disco, pero claramente lo es.

Mi apuesta es que tiene un código que genera muchas recuperaciones de archivos que no existen y obtiene un montón de almacenamiento en caché negativo. Linux eliminará estas entradas si está bajo presión de memoria, por lo que puede que no haya nada de qué preocuparse. Por ejemplo, como en este problema de NSS .

David Schwartz
fuente
55
Ah, eso podría explicar eso. Perdone mi ignorancia, pensé que eso free -msolo indicaría si la memoria se había comido debido al almacenamiento en caché del disco. Tampoco conocía el "almacenamiento en caché negativo", sería realmente interesante entender qué está tratando de encontrar archivos que no existen. ¿Alguna idea de cómo podría investigar esto, por curiosidad? Esta es una instalación reciente con solo una base de datos + aplicación web, por lo que estoy realmente sorprendido de ver este comportamiento.
Benjamin
@Benjamin Sigue mi enlace para ver un ejemplo de cómo puede suceder esto. Además, mire lo que la aplicación web está haciendo realmente.
David Schwartz
10
En realidad, uso mucho libcurl, más precisamente sus enlaces PHP. Mi servidor web descarga y procesa muchas imágenes: se descargan en la memoria, se procesan y luego se cargan en S3, sin afectar el sistema de archivos. Por lo tanto, debo admitir que pasé por alto su enlace, ya que a primera vista lo considero demasiado localizado para impactarme, pero podría ser este problema exacto: ejecuté lo mismo strace curlque el tipo y descubrí que generó 7421 ENOENT (No such file or directory) para un solo ¡consulta! Eso debe ser. ¡Muchas gracias!
Benjamin
2
Es posible que desee ver linux-mm.org/Drop_Caches y hacer echo 2 > /proc/sys/vm/drop_cachespara soltar de forma no destructiva las memorias caché de negación e inodo, y ver si su RAM regresa. Obviamente, mejor hacerlo en un momento tranquilo.
Abligh
1
Una confirmación adicional de que Linux eliminará esas entradas si está bajo presión proviene del hecho de que la mayor parte de las losas activas ( Slaben /proc/meminfo) está debajo SReclaimable(eso, como su nombre lo explica, puede recuperarse según sea necesario).
Marco Leogrande
4

Puede ser que todavía se trate de algunas estructuras internas del núcleo y del sistema de archivos / cosas relacionadas con el directorio. Esto también es perfectamente normal aunque confuso; intenta ver cuál es la salida de slabtopy cat /proc/meminfo.

Janne Pikkarainen
fuente
Agregué el resultado de estos comandos a mi pregunta, ¿podría echar un vistazo?
Benjamin
1
Bueno, parece que el núcleo consume alrededor de 27 gigabytes de RAM, y la mayor parte se destina a dentryentradas de directorio. Supongo que tienes muchos archivos en tu sistema de archivos. Esos son prácticamente solo cosas en caché, en caso de que algunos procesos realmente necesiten la memoria, se liberará de la misma manera que con el búfer / caché normal que tiende a ver en la salida superior.
Janne Pikkarainen
Es bueno saberlo, gracias. Sin embargo, estoy sorprendido ya que no tengo muchos archivos en el sistema de archivos: find / | wc -ldevoluciones 134578, no millones como dentrypodría sugerir. ¿Tienes alguna idea de qué podría hacer esto?
Benjamin
Probablemente encontró lo que genera estas entradas de directorio basura, gracias a la respuesta de David Schwartz anterior. ¡Gracias por tu ayuda de todos modos!
Benjamin