El controlador de Nvidia se instala pero no se carga en ubuntu 18.04

20

El controlador Nvidia 384 funcionó bien en Ubuntu 17.04 y 17.10. Cambié a Ubuntu 18.04 (instalación limpia y nueva) e instalé nvidia-driver-396 después de esta gran respuesta

Luego instalé cuda toolkit 9.2 usando el archivo .run. No se pudo instalar con y sin elegir instalar el controlador nvidia junto con él. Reinició e intentó nuevamente, luego cuda se instaló con éxito. Pero nvidia no se está ejecutando.

$ nvidia-settings
ERROR: NVIDIA driver is not loaded


ERROR: Unable to load info from any available system


$ nvidia-smi
NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.

$ lspci -v | grep VGA
00:02.0 VGA compatible controller: Intel Corporation HD Graphics 5500 (rev 09) (prog-if 00 [VGA controller])

Lo que he probado hasta ahora:

  1. Nvidia desinstalado ( nvidia-uninstall) Exitoso pero con advertencia: "Algunos enlaces simbólicos no se pudieron eliminar. Eliminé cuda con rm -rf /usr/local/cuda*e instalé nvidia-driver-396 pero sigue el mismo error

  2. Se eliminó nvidia-396, se instaló 396 del sitio web de nvidia (archivo .run). Comenzó con una advertencia "La distribución proporcionó el script previo fallido". Continué y la instalación fue exitosa. También agregó nouveau a la lista negra automáticamente. Sigue siendo el mismo resultado que 1.

  3. Desinstaló el anterior, eliminó la entrada de la lista negra, instaló nvidia-390 Todavía el mismo resultado

  4. Desinstaló el anterior, lo instaló desde "Controladores adicionales" desde la GUI. Ningún cambio.

  5. Fui al modo consola. Detenido gdm. Luego instaló 396. Sin cambios. Instalado 390 igualmente. Ningún cambio.

  6. Intenté usar xorg-edgers ppa (Sí, se dice que son los mismos que los controladores de gráficos ppa pero ahora estoy desesperado) Problemas de dependencia insatisfechos. Así que volvió a eliminar todo.

  7. Desinstalé todo, fui al modo de recuperación y luego instalé nvidia-driver-390. Sin suerte.

  8. Sentí que el controlador de nvidia del sitio web oficial hizo algunos cambios irreversibles. Intenté instalarlo nuevamente para poder desinstalarlo correctamente del modo de recuperación como se sugiere en la gran respuesta usando la opción --unistall. Pero ahora no se instala. El mensaje de error dice que Nouveau se está ejecutando a pesar de estar en la lista negra. Eliminé la entrada de la lista negra más tarde

Tengo Intel i5 con gráficos Intel HD junto con Nvidia GeForce 940M . Sí, se instaló nvidia-prime. Arranque dual con Windows 10, el arranque seguro está deshabilitado

Durante todos estos pasos, una vez que pude iniciar la aplicación del servidor nvidia x, aunque el nvidia-smi dio el mismo error. Una vez hubo un problema de resolución cuando Cuda ejecutó nvidia-xconfig. Eliminé el xorg.conf para arreglarlo. En este momento, mi PC tiene nouveau ejecutándose, no hay otros controladores instalados, ni nvidia lista negra, ni xorg.conf.

Alguien puede ayudar. No veo ninguna razón por la que no debería funcionar. Se informa que el controlador nvidia 390.12 funciona bien con el kernel 4.15 pero aún no funciona en el mío.

sziraqui
fuente
Asegúrese de que solo tiene una distribución en sus archivos /etc/apt/sources.d.list/, tenía varias distribuciones diferentes (biónica / cósmica / xenial, etc.) y estaba causando que fallara
Jonathan
@ Jonathan Solo tengo una distribución en ese archivo
sziraqui

Respuestas:

5

Finalmente se instaló! :RE

La causa principal fue el controlador instalado por cuda toolkit. Nunca se desinstaló correctamente. Entonces, para solucionarlo, realicé estas operaciones:

  1. Desinstale todos los paquetes relacionados con nvidia y elimine toda la lista negra.
  2. sudo update-initramfs -u
  3. Reiniciar
  4. Fui al modo de consola (Ctrl + Alt + F3), instalé el controlador de Nvidia desde el sitio web de Nvidia (archivo .run)
  5. sudo update-initramfs -u
  6. Reiniciar
  7. Fue al modo de recuperación, nvidia-uninstall
  8. # update-initramfs -u
  9. Reiniciar
  10. nvidia-driver-396Paquete instalado desde el controlador de gráficos ppa

Todo funciona bien ahora

Actualización: se rompió después de una actualización que reconstruyó el núcleo y todos los módulos dkms. El problema es con la compilación del módulo nvidia-drm. Si alguien tiene una solución permanente, publíquela y actualizaré la respuesta aceptada

sziraqui
fuente
1
Entonces puedo entender: ¿cuál fue el propósito de instalar manualmente el controlador binario y eliminarlo antes de instalar el del PPA de gráficos?
Alban Dericbourg
El archivo .run realizó algunos cambios desconocidos en el sistema. El script de desinstalación del archivo .run no pudo realizar una desinstalación completa (no se revertieron todos los cambios). El script de desinstalación era parte del binario, así que para usarlo nuevamente en modo de recuperación tuve que instalar el binario nuevamente
sziraqui
1

Gracias @sziraqui: finalmente tengo los controladores de Nvidia instalados en Ubuntu 18.04 con tu consejo junto con algunos otros. Esto es lo que tuve que hacer.

  1. Desinstalar / purgar todos los controladores de Nvidia

    sudo apt-get remove --purge nvidia * && sudo apt autoremove

  2. Descargue el controlador Nvidia del sitio web de Nvidia (archivo .run)

  3. Deshabilitar / Lista negra del controlador Noveau https://linuxconfig.org/how-to-disable-nouveau-nvidia-driver-on-ubuntu-18-04-bionic-beaver-linux

  4. Reiniciar en modo texto Ingresando los parámetros de arranque de Grub - Esto se puede hacer yendo al menú de grub en el arranque (presione Esc o Shit en el arranque) aquí presione e. Habilitación del arranque en modo texto: aquí agregue un 3 después de un inicio silencioso y presione F10 para reiniciar usando los nuevos parámetros.

  5. Identifiqué gcc usado para mi kernel y configuré la variable de entorno CC cuando ejecuté el instalador de Nvidia descargado en el paso 2.

    sudo CC = gcc-7 ./[Nvidia instalador .run archivo]

El instalador está configurado para decirle que la preinstalación falla: ignore y continúe. Permití que NVidia configurara X11 e instalé las bibliotecas de 32 bits. Reinicié y mis monitores duales están funcionando tan bien como a una resolución de 1920x1080.

Parece que el principal culpable es que el compilador gcc utilizado con los controladores Ubuntu vs.Nvidia era diferente, por lo que los instaladores automáticos nunca funcionarían. ¡Espero que esto ayude a alguien más a instalar sus controladores Nvidia en Ubuntu!

JohnP
fuente
¿Alguna vez cambiaste tu compilador de c predeterminado?
sziraqui
Ahora entendí por qué mis controladores se rompen después de una actualización. Cambié el GCC predeterminado a gcc-5 debido al proyecto actual. Cada vez que dkms reconstruye el kernel, el módulo nvidia-drm no se puede compilar porque requiere el mismo compilador que se usó para compilar el kernel del sistema operativo (gcc-7 para Ubuntu 18.04). Esto lleva a una instalación rota de controladores. Esto no se informa como un error ni por dkms ni por dpkg.
sziraqui
Configurar gcc de nuevo a gcc-7 no resolvió mi problema.
sziraqui
¿Alguien ha tenido éxito en resolver este problema? He intentado todo tipo de soluciones para esto, pero fue en vano. Realmente no quiero usar Windows en esta máquina. Si alguien ha tenido éxito en la resolución del problema, ¡ayúdame!
Sachin Borkar