Error EXT4-fs después de la actualización de Ubuntu 17.04

18

Tengo un Dell XPS 15 9550 . He estado ejecutando Ubuntu 16.10 en él durante cuatro meses sin dramas.

Hace dos días, actualicé a Ubuntu 17.04 . Aproximadamente una hora después de la actualización, mi disco duro se volvió a montar en modo de solo lectura. Cuando salté a una pantalla tty, apareció:

[ 746.341551] EXT4-fs error (device nvme0n1p7): ext4_find_entry:1463: inode #525023: comm NetworkManager: reading directory iblock 0
[ 746.343318] EXT4-fs error (device nvme0n1p7): ext4_find_entry:1463: inode #524289: comm pool: reading directory iblock 0
[ 746.356125] EXT4-fs error (device nvme0n1p7): ext4_find_entry:1463: inode #11272213: comm systemd-udevd: reading directory iblock 0
[ 746.356139] EXT4-fs error (device nvme0n1p7): ext4_find_entry:1463: inode #11272210: comm systemd-udevd: reading directory iblock 0
[ 746.356332] EXT4-fs error (device nvme0n1p7): ext4_find_entry:1463: inode #11272193: comm systemd-udevd: reading directory iblock 0
[ 746.356338] EXT4-fs error (device nvme0n1p7): ext4_find_entry:1463: inode #11272825: comm systemd-udevd: reading directory iblock 0
[ 746.356400] EXT4-fs error (device nvme0n1p7): ext4_find_entry:1463: inode #11272210: comm systemd-udevd: reading directory iblock 0
[ 746.474632] EXT4-fs error (device nvme0n1p7): ext4_find_entry:1463: inode #524539: comm unity-settings-: reading directory iblock 0
[ 746.992814] EXT4-fs error (device nvme0n1p7): ext4_find_entry:1463: inode #5506108: comm BrowserBlocking: reading directory iblock 0
[ 746.304451] EXT4-fs error (device nvme0n1p7): ext4_find_entry:1463: inode #5506117: comm BrowserBlocking: reading directory iblock 0

Esto es lo que fdisk -lmuestra:

Disk /dev/nvme0n1: 477 GiB, 512110190592 bytes, 1000215216 sectors
Units: sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes
Disklabel type: gpt
Disk identifier: 3CD27380-DAC8-48DC-910A-D084CE857DA3

Device             Start        End   Sectors   Size Type
/dev/nvme0n1p1      2048    1026047   1024000   500M EFI System
/dev/nvme0n1p2   1026048    1288191    262144   128M Microsoft reserved
/dev/nvme0n1p3   1288192  487948287 486660096 232.1G Microsoft basic data
/dev/nvme0n1p4 972302336  973223935    921600   450M Windows recovery environmen
/dev/nvme0n1p5 973223936  998094847  24870912  11.9G Windows recovery environmen
/dev/nvme0n1p6 998094848 1000204287   2109440     1G Windows recovery environmen
/dev/nvme0n1p7 487948288  939046911 451098624 215.1G Linux filesystem
/dev/nvme0n1p8 939046912  972302335  33255424  15.9G Linux swap

Partition table entries are not in disk order.

Reinicié y seguí recibiendo el error una vez por hora. Así que reinstalé Ubuntu 17.04 desde cero . Sin embargo, sigo teniendo el mismo problema.

Intenté ejecutar fsck creando un archivo / forcefsck (creé un script de shell de contenedor que agrega la -vbandera y genera stdout en un archivo). Aquí está el resultado:

fsck.fat 4.0 (2016-05-06)                               
Checking we can access the last sector of the filesystem
Boot sector contents:                                   
System ID "MSDOS5.0"                                    
Media byte 0xf8 (hard disk)                             
       512 bytes per logical sector                     
      4096 bytes per cluster                            
      6206 reserved sectors                             
First FAT starts at byte 3177472 (sector 6206)          
         2 FATs, 32 bit entries                         
    508416 bytes per FAT (= 993 sectors)                
Root directory start at cluster 2 (arbitrary size)      
Data area starts at byte 4194304 (sector 8192)          
    126976 data clusters (520093696 bytes)              
63 sectors/track, 255 heads                             
      2048 hidden sectors                               
   1024000 sectors total                                
Reclaiming unconnected clusters.                        
Checking free cluster summary.                          
/dev/nvme0n1p1: 212 files, 15526/126976 clusters    

Intenté arrancar desde un USB en vivo y ejecutar e2fsck -p /dev/nvme0n1p7como se sugiere aquí ( /ubuntu//a/768813/679041 ). No dio ningún error.

También intenté ejecutar, smartctl -t long /dev/nvme0n1p7sin embargo, los resultados parecen indicar que la herramienta no funciona con mi SSD particular:

smartctl 6.6 2016-05-31 r4324 [x86_64-linux-4.10.0-19-generic] (local build)
Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Number:                       PM951 NVMe SAMSUNG 512GB
Serial Number:                      S29PNX0H611013
Firmware Version:                   BXV77D0Q
PCI Vendor/Subsystem ID:            0x144d
IEEE OUI Identifier:                0x002538
Controller ID:                      1
Number of Namespaces:               1
Namespace 1 Size/Capacity:          512,110,190,592 [512 GB]
Namespace 1 Utilization:            254,982,533,120 [254 GB]
Namespace 1 Formatted LBA Size:     512
Local Time is:                      Mon Apr 17 17:45:48 2017 AEST
Firmware Updates (0x06):            3 Slots
Optional Admin Commands (0x0017):   Security Format Frmw_DL *Other*
Optional NVM Commands (0x001f):     Comp Wr_Unc DS_Mngmt Wr_Zero Sav/Sel_Feat
Maximum Data Transfer Size:         32 Pages

Supported Power States
St Op     Max   Active     Idle   RL RT WL WT  Ent_Lat  Ex_Lat
 0 +     6.00W       -        -    0  0  0  0        5       5
 1 +     4.20W       -        -    1  1  1  1       30      30
 2 +     3.10W       -        -    2  2  2  2      100     100
 3 -   0.0700W       -        -    3  3  3  3      500    5000
 4 -   0.0050W       -        -    4  4  4  4     2000   22000

Supported LBA Sizes (NSID 0x1)
Id Fmt  Data  Metadt  Rel_Perf
 0 +     512       0         0

=== START OF SMART DATA SECTION ===
Read NVMe SMART/Health Information failed: NVMe Status 0x2002

¿Alguna idea de por qué este problema podría estar ocurriendo y cómo podría resolverlo? ¡Gracias! :)

Ben B
fuente
1
¡Bienvenido a AskUbuntu! Parece que este error puede afectarlo . Recomiendo que informe a los desarrolladores que este error también lo afecta y que se suscriba al error para que pueda ser notificado del progreso / resolución.
Élder Geek
Tengo exactamente el mismo problema en un Lenovo Thinkpad X270 con un SSD Toshiba "THNSF5256GPUK TOSHIBA". Supongo que es bueno saber que no soy el único.
Maeher
@ElderGeek leyendo el informe de error vinculado, parece que hasta que se solucione el problema, una solución temporal sería deshabilitar APST, sin embargo, de la discusión allí no me queda claro cómo hacerlo. Parece que una forma de hacerlo sería una respuesta válida a esta pregunta.
Maeher
Gracias por sus comentarios chicos :) Impaciente, reinstalé nuevamente anoche, sin embargo, esta vez formateé explícitamente / dev / nvme0n1p7 y eliminé / dev / nvme0n1p8 de antemano (pensé que tal vez una reinstalación con todas las opciones predeterminadas podría no formatearse realmente, y en su lugar solo elimine los archivos antiguos antes de instalar los nuevos). Todavía tengo que experimentar el problema después de 4 horas de uso ininterrumpido, sin embargo, solo el tiempo lo dirá. Escucharé mis sollozos en todo el Pacífico si lo hago :)
Ben B
OK, puedo confirmar: acabo de recibir el problema nuevamente a pesar de formatear completamente la partición. Agregará un comentario al error vinculado anteriormente
Ben B

Respuestas:

19

Como se señaló en un comentario del élder Geek , esto se debe a un error conocido .

Del informe de error:

El soporte de APST acaba de aterrizar en el último núcleo Zesty (4.10.0-14.16) como parte de https://bugs.launchpad.net/ubuntu/+source/linux/+bug/1664602 . Ese parche tiene una peculiaridad para ciertas unidades Samsung de 256 GB que se encuentran en las computadoras portátiles Dell que no se comportan bien cuando APST está habilitado. Estoy experimentando los mismos síntomas con el mismo modelo de computadora portátil, excepto con un Samsung de 512 GB. Antes de deshabilitar manualmente APST, la unidad moriría y el sistema se incendiaría con errores de E / S dentro de los 20 a 40 minutos posteriores al arranque.

Hasta que se implemente una solución adecuada, se sugiere una solución alternativa, que implica agregar un parámetro de kernel :

Intente nvme_core.default_ps_max_latency_us=5500, si el problema persiste, inténtelo nvme_core.default_ps_max_latency_us=200.

Para agregar un parámetro de arranque del kernel, edite el archivo de configuración para GRUB:

sudo nano /etc/default/grub

Encuentre el comienzo de la línea GRUB_CMDLINE_LINUX_DEFAULTy agregue el parámetro de arranque a los otros que ya están entre comillas. Por ejemplo, en este caso, probablemente terminará con

GRUB_CMDLINE_LINUX_DEFAULT="quiet splash nvme_core.default_ps_max_latency_us=5500"

Guarde el archivo y salga, luego para que el cambio sea efectivo, ejecute

sudo update-grub 
Ben B
fuente
1
¿Esta solución te funciona? Por cierto, un enlace sobre cómo establecer los parámetros del kernel para quién podría tropezar con su respuesta wiki.ubuntu.com/Kernel/KernelBootParameters
justmyfault
1
Estoy ejecutando Ubuntu 16.04 y he estado actualizando paquetes poco a poco, algo que no recomendaría a nadie, pero lo hago por necesidad. El último paquete era libc, algo tan integral para el sistema que si algo salía mal sería al actualizar libc. Al reiniciar, vi todos los errores EXT4 mencionados en la pregunta anterior, pero agregar el parámetro del kernel finalmente me permitió reiniciar en paz y continuar. Gracias.
lukecampbell
alguna actualización sobre esto? Estoy sufriendo este problema en mi sigilosa razer blade con un Samsung ssd de 512 gb
Lucas Zanella
La solución anterior funcionó para mí, pero el error se ha solucionado en el paquete linux - 4.10.0-22.24. Si todavía tiene problemas, debe abrir un nuevo informe de error en el launchpad.
Ben B
Probé ambos valores, pero aún así se bloqueó. nvme_core.default_ps_max_latency_us = 0 funcionó para mí. Kernel 4.15.0-36-generic Ubuntu 16.04
Mike Schroll
0

Primero, visitaría el sitio web de soporte de Samsung y me aseguraría de que tiene instalado el último firmware para su modelo SSD.

Entonces, tu fsck no tenía mucho sentido, así que hazlo de esta manera ...

Para verificar el sistema de archivos en su partición Ubuntu ...

  • arrancar al menú GRUB
  • elija Opciones avanzadas
  • elige el modo de recuperación
  • elegir acceso de raíz
  • en el indicador #, escriba sudo fsck -f /
  • repita el comando fsck si hubo errores
  • tipo reboot
heynnema
fuente
1
¡Gracias por su respuesta! He reinstalado, pero esta vez formateé explícitamente la partición problemática primero (en caso de que el proceso de reinstalación predeterminado no se formateara realmente). Espero que esté bien ahora, sin embargo, si el problema persiste, ejecutaré un fsck y publicaré los resultados (aunque diría que si el problema persiste en una partición recién formateada, podría estar más allá de las capacidades de fsck)
Ben B
El problema ocurrió nuevamente, sin embargo, como lo señaló el élder Geek en los comentarios debajo de mi pregunta, parece deberse a un error conocido ( bugs.launchpad.net/ubuntu/+source/linux/+bug/1678184 ).
Ben B
@BenB, ¿alguna vez comprobaste el firmware de tu SSD Samsung, como te había sugerido anteriormente? Dependiendo del modelo, tenían algunas actualizaciones muy obligatorias para que la unidad funcionara correctamente.
heynnema
En realidad no estoy 100% seguro de cómo hacer esto. Encontré algo de firmware aquí, sin embargo, no estoy 100% seguro de que alguno de ellos se aplique a mi SSD en particular. El informe de error no apunta a ningún problema relacionado con el firmware de todos modos, por lo que en este punto prefiero esperar más información de los desarrolladores que abordan el error antes de intentar actualizar el firmware (conociéndome, lo haría mal y perder todas mis cosas: P)
Ben B
1
fsck no muestra errores. El problema no es ningún tipo de problema de firmware o corrupción de SSD. Se debe a APST, que se habilitó en 17.04. Establecer el parámetro del kernel 'nvme_core.default_ps_max_latency_us = 5500' me ha solucionado el problema, y ​​otros han informado que deshabilitar APST lo soluciona por completo.
Ben B
0

Una posible solución al error conocido que mencioné y que no puedo probar, ya que no tengo el hardware NVMe en cuestión, sería intentar arrancar el paquete de compilación del núcleo diario actual de la línea principal para su arquitectura disponible aquí.

¡Espere! Antes de salir corriendo para probar esto, debo enfatizar que, a menos que esté seguro de saber exactamente lo que está haciendo y cómo recuperarse de las consecuencias imprevistas, es muy recomendable hacer una copia de seguridad.

Si no sabe lo que está haciendo y tiene una copia de seguridad actual, puede encontrar más información sobre cómo construir su núcleo aquí.

Nota: en caso de que haya leído la primera oración, esta respuesta se basa en investigaciones, no en pruebas. Si se rompe, restaure su copia de seguridad.

Elder Geek
fuente