Ubuntu se congela mientras instala CUDA durante el paso de certificados ca

0

En primer lugar, gracias por su tiempo y ayuda en este foro y en particular por ayudarme con mi problema.

Contexto

Compré un Alienware Area 51 R4 por trabajo. Las especificaciones de hardware son las siguientes:

  • 237.37 [GB] NVMe KXG50ZNV256G (Windows 10 está aquí)
  • 2 [TB] ST2000DM001-1ER164 (Ubuntu está aquí)
  • NVIDIA GeForce GTX 1080
  • Intel Core i7-7820X

Instalar Ubuntu 18.04.2 LTS Bionic Beaver fue una pesadilla, todo falló. Tengo una computadora portátil Alienware desde 2015 y el proceso de arranque dual de Windows 10 y Ubuntu 18.04 fue realmente fácil, todo funciona sin problemas.

La forma en que finalmente logré instalar Ubuntu en mi Área 51 es instalarlo en el HDD secundario y dejar que Windows 10 solo en el SSD.

Las particiones de Ubuntu se crearon siguiendo esta guía:

Arranque dual con discos duros separados

GRUB no reconoce mi SSD de Windows, por lo que la forma en que cambio entre ambos SO es a través del BIOS. Creo que esto tiene que ver con el Intel RST habilitado, he leído que debería haber cambiado a AHCI, pero en ese momento me pareció demasiado arriesgado.

Solo para comentar:

  • El arranque seguro está apagado
  • El arranque rápido está apagado.
  • La hibernación está apagada.

Problema

Estoy tratando de instalar CUDA 9.0, con:

sudo dpkg -i cuda-repo-ubuntu1704-9-0-local_9.0.176-1_amd64.deb
sudo apt-key add /var/cuda-repo-9-0-local/7fa2af80.pub
sudo apt-get update
sudo apt-get install cuda

Nota: Naturalmente, ya he instalado los controladores de GPU antes.

Cuando ingreso el último comando, el sistema se congela por completo y se reinicia.

Imagen del último informe antes de que la computadora se congele

Como puede ver, el problema informado es:

head: no se puede abrir 'etc / ssl / certs / java / cacerts' para leer: No existe tal archivo o directorio

Después de eso, la computadora se congela y se reinicia.

Yo he tratado:

sudo update-ca-certificates

Crea el archivo cacerts que falta, pero cuando intento instalar CUDA nuevamente, se congela. El archivo cacerts parece casi vacío en comparación con el existente en mi computadora portátil.

También he intentado (como lo sugiere el archivo cacerts que falta ):

sudo dpkg --purge --force-depends ca-certificates-java
sudo apt-get install ca-certificates-java

El segundo comando congela la computadora.

He estado lidiando todo este día con este problema y he comenzado a caer en la desesperación.

Cualquier sugerencia sería muy apreciada, gracias.

Actualización (10.04.2019): decidí borrar Ubuntu del disco duro secundario porque sospechaba que no estaba instalado correctamente. Además, decidí desactivar Intel RST y AHCI, tomando, por supuesto, las medidas apropiadas para poder acceder a Windows 10. El HDD se borró, formateó por completo y la lista de entradas UEFI se editó para borrar Ubuntu de ella. Fue como comenzar de nuevo con una computadora nueva.

Con este contexto, procedo a instalar Ubuntu una vez más, esta vez fue mucho más fácil. Mi SSD principal se detectó con una partición de Windows, estaba muy feliz. Sin embargo, procedo a instalarlo en el HDD porque prefiero tenerlos en unidades separadas. Hasta ese momento, todo fue tranquilo.

El sistema y las actualizaciones de software comenzaron y antes de finalizar, el sistema se congeló y reinició, una pena. Logré resolver ese problema y proceder a instalar los controladores y CUDA. Y una vez más, durante la instalación de CUDA, se bloqueó una vez más en el mismo paso que antes.

Esta mañana, probé la sugerencia de @ Turtle10000 pero una vez más, traté de instalar los certificados de CA y fallé.

Tengo algunas ideas para probar, las actualizaré. Gracias por tu tiempo.

Actualización y solución (12.04.2018):

Finalmente logré resolver mi problema.

No voy a contarte todas las pruebas que hice, pero si tienes un Alienware Area 51 R4 y quieres usar Ubuntu 18.04 junto con CUDA, asegúrate de que se pueda hacer. Debes seguir esta receta que me llevó 2 semanas descubrir:

El primer orden del día es instalar Ubuntu y debe cumplir con los siguientes requisitos:

  • El arranque seguro debe estar apagado
  • El arranque rápido debe estar apagado.
  • La hibernación debe estar apagada.
  • Para que Ubuntu vea ambas unidades de almacenamiento, Intel RST debe estar deshabilitado y AHCI debe estar habilitado, debe tomar las medidas adecuadas para poder acceder a Windows 10 nuevamente. Esta pequeña guía ( RAID a AHCI ) es, en mi opinión, la forma más fácil de hacerlo.

Nota: Ninguno de los pasos se puede omitir.

Si verifica su versión UEFI / BIOS, notará que está terriblemente desactualizada, será la versión 1.5.xy posterior a 2017. Entonces, desde Windows, ingrese a 'Alienware Updates' y actualice todo, una de las actualizaciones críticas debería ser el UEFI / BIOS. Se actualizará a la versión 2.xx a partir de marzo de 2019. Este es quizás el paso más crítico.

Después de eso, puede proceder a instalar Ubuntu, debería ver ambas unidades de almacenamiento y poder elegir dónde y cómo desea instalarlo. En mi caso, elegí la unidad secundaria (2 [TB] - HDD) y particioné la unidad con la ayuda de la guía que cité anteriormente.

Una vez que Ubuntu esté instalado, inicie sesión y si aparece alguna sugerencia de actualización de paquetes, haga clic en 'Recordarme más tarde'. Después de eso, procedo a instalar el controlador NVIDIA apropiado para mi GPU para evitar cualquier tipo de problema. Aquí, el controlador NVIDIA para GeForce GTX 1080 , Luis probó el controlador para un 1080 con Vulkan, así que seguí sus instrucciones.

Después de este último paso, puede proceder a actualizar los paquetes de Ubuntu a través del Actualizador de software o a través del terminal sin ningún problema. Finalmente, descargue CUDA, en mi caso, descargué CUDA 10.1 y lo instalé de acuerdo con las instrucciones. La instalación debe completarse sin problemas.

Tenga en cuenta que si elige CUDA 10.1, el controlador se actualizará automáticamente a la versión 418.56.

No he experimentado ningún tipo de congelación o suspensión de Ubuntu. Creo que actualizar el BIOS / UEFI e instalar desde el principio el controlador apropiado fue lo que resolvió mi problema.

Gracias por leer y buena suerte.

Inu01
fuente

Respuestas:

0

Recomendaría ejecutar sudo apt upgradeprimero, ya que tiene 281 paquetes obsoletos que pueden provocar problemas en sí mismos.

Además, la instalación con el archivo .deb(o .run) es muy propensa a errores. Recomiendo instalar CUDA desde las fuentes, que siempre funcionó sin problemas para mí.

sudo add-apt-repository ppa:graphics-drivers/ppa

sudo apt update

sudo ubuntu-drivers autoinstall

reiniciar

sudo apt install nvidia-cuda-toolkit gcc-6

nvcc --version
Tortuga10000
fuente