¿Qué puede hacer que las tarjetas gráficas PCIe fallen aleatoriamente durante el arranque?

1

Tengo un sistema que actualmente me está volviendo loco, y espero que alguien aquí en StackExchange pueda señalar algo que estoy haciendo mal.

La computadora es de fabricación casera y consta de:

  • CPU: Intel Core i7 4790K (stock @ 4GHz)
  • MB: Gigabyte GA-Z97X-Gaming G1 WIFI-BK
  • RAM: G.skill Trident X F3-2400C10Q-32GTX (kit combinado de 8GBx4)
  • GFX: 2x Gigabyte GV-N980G1 GAMING-4GD GTX 980 (SLI)
  • PWR: Corsair HX1000i
  • SO: Windows 8.1 Pro

Cada vez que enciendo la máquina, es un sorteo si las tarjetas gráficas se conectarán o no. Si tengo suerte, las tarjetas se encienden y obtengo una señal de visualización (a través de la salida DP) en mi monitor principal. Cuando esto sucede, la máquina parece funcionar correctamente hasta que se apaga y vuelve a encender, aunque su rendimiento está muy por debajo de donde debería estar para el hardware (puntuación de 3DMark Fire Strike Extreme de aproximadamente 8000, en comparación con 10100 de Futuremark para un sistema de referencia con CPU idéntica y tarjetas gráficas).

Si no tengo suerte, la máquina arranca y el video se conecta con los gráficos integrados de Intel (que he enviado a un segundo monitor). El administrador de dispositivos no detecta las tarjetas NVIDIA en absoluto. No se muestran como "dispositivo desconocido", no se muestran como "inicio fallido", solo faltan por completo.

Siguiendo el procedimiento habitual para este tipo de situaciones, he quitado y vuelto a colocar la placa base, las tarjetas, la fuente de alimentación y todas las conexiones de alimentación. Lo he verificado para asegurarme de que no haya conductores sueltos que puedan causar cortocircuitos. Verifiqué las temperaturas de la CPU y la GPU para asegurarme de que funcionan bien dentro de los límites térmicos bajo carga (aproximadamente 65 ° C para las GPU y 55 ° C para la CPU).

Estoy completamente desconcertado por esto. Cualquier sugerencia (no importa cuán obvia) sería muy apreciada.

Actualizado:

A petición de Journeyman Geek en los comentarios, he realizado pruebas en la máquina con cada tarjeta gráfica instalada individualmente. Esto parece resolver el problema: he arrancado el sistema aproximadamente una docena de veces con cada tarjeta y todavía no ha fallado. Además, 3DMark confirma que las tarjetas funcionan individualmente en promedio para esta configuración de hardware con una sola GPU.

Por lo tanto, este problema parece estar específicamente relacionado con el uso de las dos tarjetas en una configuración SLI.

Actualmente estoy haciendo algunas pruebas más con las dos tarjetas en una configuración de ranura PCIe diferente (1 y 2 en lugar de 1 y 3) para ver si tal vez tengo una ranura incorrecta en la placa.

Actualización 2:

La configuración de las ranuras 1 y 2 funcionó bien y superó 9600 en 3DMark Fire Strike Extreme. (Bajo, pero eso se espera con dos tarjetas de doble ancho una al lado de la otra; se sobrecalentarán y se estrangularán térmicamente entre sí sin un sistema de cambio de fase o líquido resistente).

Después de ejecutar algunas pruebas en esta configuración, vuelvo a colocar las tarjetas en 1 y 3. Ahora todo funciona correctamente en otra docena de botas. El sistema ahora incluye 10800 en FSE.

Por mi vida no puedo entender qué es posiblemente diferente esta vez en comparación con la media docena de veces que he vuelto a colocar las cartas antes. Seguiré ejecutando esta configuración durante un par de días y cerraré mi pregunta como "causada por duendes" si no puedo reproducir la condición de error nuevamente.

Dan Story
fuente
Me pregunto si tiene suficiente potencia, pero supongo que un suministro de calidad de 1KW debería ser suficiente. ¿Una sola tarjeta funciona de manera confiable? Además, estás hablando específicamente de tarjetas de video, hay otras tarjetas PCIe por ahí :)
Journeyman Geek
En teoría, el TDP máximo de las GPU es de 165 W cada una, y la CPU es de 88 W. (No mencioné en la pregunta, pero hay un SSD y dos HHDD en el sistema, así como un quemador de Blu-ray, ninguno de los cuales debería consumir mucha energía). En cualquier medida razonable, una fuente de alimentación de 1KW debería exceder los requisitos de energía del sistema, incluso si se suponía que funcionaba con una eficiencia del 60%.
Dan Story
Sí, podría tener algunas teorías más, pero comenzaría probando con una sola tarjeta gráfica. Probablemente deberías tener suficiente poder para lo que estás haciendo, lo que hace que esto sea un poco más curioso.
Journeyman Geek
@JourneymanGeek Pregunta actualizada con resultados de pruebas de una sola tarjeta.
Dan Story
Bueno, estoy desconcertado. Tentado a publicar una respuesta, pero no tengo idea de por qué funciona ahora. Supongo que algo estaba flojo en alguna parte, y la prueba de una sola tarjeta aseguró que lo hiciste bien;)
Journeyman Geek

Respuestas:

0

Definitivamente tiene una computadora de juego robusta, pero aún sospecharía primero de la fuente de alimentación: confirme que su fuente de alimentación cumpla o exceda la potencia recomendada en los rieles de 12V y luego compárelo con lo que deben cumplir las especificaciones de los 980.

Mencionó Windows 8.1, por lo que también diría que mire sus registros y vea si puede obtener más información sobre por qué sus controladores no se muestran.

Me encontré con este problema con dos 980 en enero, pero no me molesté en investigar más porque me actualicé a una placa base ASUS y una fuente de alimentación Thermaltake anterior y el problema desapareció.

ClaireW
fuente