¿Cómo diagnosticar bloqueos y bloqueos de la computadora?

29

Construí una computadora de escritorio hace un par de años con las siguientes especificaciones:

  • CPU: Intel Core 2 Quad Q9300 Yorkfield 2.5GHz 6 MB L2 Cache LGA 775 95W Procesador de cuatro núcleos BX80580Q9300
  • Placa base: EVGA 122-CK-NF68-T1 LGA 775 NVIDIA nForce 680i SLI ATX Placa base Intel
  • Tarjeta de video: Dos tarjetas de video compatibles con EVGA 256-P2-N758-TR GeForce 8600GT SCC 256 MB 128-bit GDDR3 PCI Express x16 SLI
  • Fuente de alimentación: SeaSonic S12 Energy Plus SS-550HT 550W ATX12V V2.3 / EPS12V V2.91 SLI Certified CrossFire Ready 80 PLUS Certified Active PFC Power Supply
  • Memoria: Dos G.SKILL 4 GB (2 x 2 GB) 240-pin DDR2 SDRAM DDR2 800 (PC2 6400) Kit de doble canal Memoria de escritorio Modelo F2-6400CL5D-4GBPQ

Desde su inicio, la máquina se ha bloqueado periódicamente, la regularidad ha variado a lo largo de los años de una vez al día a una vez al mes. Por lo general, los bloqueos ocurren una vez cada pocos días.

Por "bloqueo" quiero decir que mi computadora se congela. La pantalla se bloquea, no puedo mover el mouse. Al presionar teclas en mi teclado que normalmente encienden o apagan los LED en el teclado (como el bloqueo de mayúsculas) ya no encienden o apagan los LED. Si se escuchaba música en el momento del bloqueo, el ruido sigue saliendo de los altavoces, pero es solo la frecuencia / nota actual la que se reproduce indefinidamente. No hay BSOD.

Cuando se produce un bloqueo de este tipo, tengo que hacer un reinicio completo apagando la computadora o presionando el botón de reinicio.

Tengo la versión más reciente de los controladores de hardware de NVIDIA y los actualizo de forma semi-regular, pero eso no parece ayudar. Actualmente estoy usando Windows 7 x64, pero anteriormente estaba usando Windows Server 2003 x64 y tenía los mismos problemas de bloqueo.

Mi conjetura es que es conductor de alguna manera relacionada con vídeo o placa base, pero no sé cómo hacer para diagnosticar este problema de reducir cuál de los dos es el culpable.


Información adicional sobre: ​​refrigeración En cuanto a la refrigeración ... No he instalado ningún sistema de refrigeración fuera del mercado aparte de dos ventiladores normales que eliminé de una computadora más antigua. El ventilador sobre la CPU es el que se envió con él. Uno de los dos ventiladores recolectados lo agregué ubicado en la torre inferior de la esquina, en un intento de crear un flujo de aire de adelante hacia atrás. El segundo ventilador apunta directamente a las dos tarjetas de video.


Instalación y lecturas de SpeedFan Por sugerencia de studiohack, instalé SpeedFan , que proporcionó las siguientes lecturas de temperatura:

  • GPU: 63C
  • GPU: 65C
  • Sistema: 76C
  • CPU: 64C
  • AUX: 36C
  • Núcleo 0: 78C
  • Núcleo 1: 76C
  • Núcleo 2: 79C
  • Núcleo 3: 79C

Actualización n. ° 3: Otro bloqueo :-( Bueno, tuve otro bloqueo anoche. :-( SpeedFan informó la temperatura de la CPU a 38 C cuando sucedió, y no hubo un pico de temperatura que condujera al congelamiento.

Una cosa que noto es que la congelación parece más probable que ocurra si estoy viendo un video. De hecho, de los últimos 5 bloqueos en el último mes, 4 de ellos han estado viendo un video en Flickr. No necesariamente el mismo video, pero sí un video. No sé si esto es solo una coincidencia o si significa algo. (Como comentario aparte, cada noche antes de acostarse, mi hija de 2 años se sienta en mi regazo y mira algunos videos caseros en Flickr y, en el último mes, aprendió la frase, "Uh oh, la computadora se rompió").


Actualización n. ° 4: Resultados de la prueba MemTest86 y 3DMark06 :

Según las sugerencias en los comentarios, ejecuté el MemTest86 de la noche a la mañana y recorrí los 8 GB de memoria 5 veces sin error. También realicé la prueba 3DMark06 sin problemas (consulte mis puntajes en http://3dmark.com/3dm06/15163549 ).

¿Y ahora qué? :-)

¿Alguna sugerencia adicional sobre qué verificar? ¿Hay alguna forma de obtener un seguimiento de la pila o algo así cuando la computadora se bloquea de esa manera?

Resolución

Nunca he resuelto los problemas particulares, pero según las sugerencias aquí y en otros lugares, supongo que fue un problema de la placa base. En cualquier caso, recientemente actualicé mi sistema, comprando una nueva motherbeard, PSU, CPU y RAM, y esa nueva plataforma ha estado funcionando espléndidamente en las últimas semanas. Estoy usando las mismas tarjetas gráficas que en la configuración anterior, por lo que creo que es seguro razonar que no fueron la causa del problema.

Scott Mitchell
fuente
La primera palabra que me viene a la mente es calor ... ¿cómo mantiene fresco el sistema?
James Mertz
@KronoS: edité mi pregunta para incluir la situación de enfriamiento. Tenga en cuenta que no estoy usando ningún software de monitoreo de temperatura de CPU.
Scott Mitchell
2
Debe instalar SpeedFan y hacernos saber las temperaturas ...
studiohack
@studiohack: Gracias por la sugerencia: descargué e instalé SpeedFan y edité mi pregunta para incluir estas nuevas lecturas. ¿Son normales estas lecturas de temperatura?
Scott Mitchell
2
@Scott Descargar 3dMark '06 y FurMark lo dejaron funcionar durante un par de horas. Reporte cualquier falla. Si se
bloquea

Respuestas:

11

A juzgar por lo que publicaste en cuanto a temperatura y enfriamiento, tu computadora se está sobrecalentando y eso es lo primero que debes corregir. 64 C en una carga inactiva no es aceptable y no se prefiere realmente con una carga completa. Estoy un poco paranoico y enloquezco cada vez que mi CPU supera los 35, pero realmente 50 deberían ser tu máximo en una carga.

Invierta en una buena solución de enfriamiento para su sistema. Un sistema bastante decente solo te costará entre 20 y 30 dólares. Si está buscando ayuda sobre qué buscar, eche un vistazo a esta revisión de Tom's Hardware de soluciones de refrigeración por menos de $ 40.

También es posible que desee habilitar su pantalla azul de la muerte (tan terrible como suena) para que pueda depurar los bloqueos problemáticos. Esto se hace por:

-> haciendo clic derecho en "Computadora" en el menú de inicio

-> Seleccione "Propiedades"

-> Seleccione "Configuración avanzada del sistema"

-> Seleccione la pestaña "Avanzado"

-> Seleccione el "Inicio y recuperación"

-> Asegúrese de que esté habilitado "Escribir un evento en el registro del sistema".

A veces hay limpiadores que automáticamente detienen la grabación de BSOD ( Advanced System Care ) y es posible que desee evitarlo. Una vez que haya verificado este problema, le sugiero que use BlueScreenView de NirSoft para ver los detalles del bloqueo / problemas relacionados con la depuración.

Finalmente, verificaría y volvería a verificar su PC y TODAS sus conexiones. En realidad, tuve una situación similar y descubrí que uno de los cables USB internos de la placa base estaba conectado incorrectamente, causando problemas.

Actualizar

He reunido algunas preguntas para la resolución de problemas generales y el diagnóstico de bloqueos o bloqueos. Por favor, consúltelos también, ya que también pueden ayudarlo en su búsqueda del problema.

James Mertz
fuente
@KronoS: ¿Tiene algún sistema de enfriamiento recomendado que quiera compartir?
Scott Mitchell
@ScottMitchell ... respuesta actualizada. Sin embargo, le recomiendo que investigue, ya que la situación de cada Superusuario es diferente.
James Mertz
3
@ScottMitchell Le recomendaría que cambie el material de la interfaz térmica (TIM, también conocido como pasta térmica) antes de agregar cualquier refrigeración externa. Además, verifique que no haya polvo en los ventiladores / parrillas / respiraderos y límpielos con un chorro de aire comprimido.
Sathyajith Bhat
@Sathya: Gracias por la sugerencia. Rompí el caso la semana pasada y tuve la computadora funcionando por un día con un caso abierto y las temperaturas cayeron a los 40. Esta mañana inspeccioné el sistema de enfriamiento existente de la CPU y noté mucho polvo cubriendo las parrillas debajo del ventilador, así que las limpié. Vuelvo a colocar el estuche y veremos si las temperaturas se mantienen bajas y si eso ayuda a evitar futuras congelaciones. (Si es así, marcaré esto como la respuesta ...)
Scott Mitchell
@Scott Ah, me alegra saberlo, mantennos actualizados
Sathyajith Bhat
5

Los bloqueos duros del sistema (donde no puede usar teclas de acceso rápido como CTRL + ALT + SUPR) son causados ​​por controladores colgantes,
por lo que deberá reemplazar el dispositivo o actualizar el controlador. La solución de problemas se puede hacer:

  1. Descargue la configuración de Windows Performance Analysis Tools para su versión de Windows.
  2. Instale el software en su sistema.
  3. Abra un símbolo del sistema como administrador y copie y pegue el siguiente comando:

    xperf -start perf!GeneralProfiles.InBuffer && timeout -1 && xperf -stop perf!GeneralProfiles.InBuffer myTrace.etl
    
  4. Presione ENTER una vez para iniciar el comando, ahora tendrá que esperar hasta que su sistema se bloquee.
    Puedes hacer lo que quieras. Por favor, no hay actividad pesada como juegos o cosas privadas ...

  5. Justo después de que su sistema deja de colgar , vaya a la consola y presione ENTER.
  6. Después de esperar un tiempo, se generará un archivo de registro myTrace.etl, comprímalo en un archivo zip.
  7. Ponga esta versión comprimida del archivo en algún lugar en línea (quizás 2shared).
  8. Comparta el enlace aquí, intentaré encontrar y mostrarle la causa de su problema.
Tamara Wijsman
fuente
11
Pregunta re: paso 5: ¿qué debo hacer si el sistema nunca deja de bloquearse hasta que reinicie la máquina?
Scott Mitchell
@ScottMitchell: intente crear un volcado por caída manual en su lugar en ese caso.
Tamara Wijsman
4

Si han pasado un par de años desde que se construyó la computadora, entonces una limpieza a fondo sería un buen curso de acción. Elimine todo el polvo de los ventiladores, disipadores de calor, tablas y esquinas. Las partes más importantes son los disipadores de calor y los ventiladores de la CPU. El aire comprimido es bueno para este propósito, pero una aspiradora puede ser más saludable a largo plazo. Hacer esto a fondo reducirá en gran medida la ventilación y el calor.

El calor no debería haber sido un problema con una computadora nueva, a menos que se mantenga en una habitación (o gabinete) muy cálida y con poca ventilación. Los fabricantes de CPU anticipan que sus productos se utilizarán en diferentes condiciones e incluso el disipador de calor y el ventilador de serie están hechos para permitir que el producto funcione en la mayoría de las circunstancias.

Dado que ha tenido los problemas desde que lo construyó, tiendo a inclinarme hacia una falla en uno de los componentes. Según los problemas descritos, me inclino hacia una placa base defectuosa, solo por mi propia experiencia.

Xantec
fuente
1
Como señalé en mi pregunta, este problema de congelamiento ha estado ocurriendo con cierta regularidad desde que construí la computadora. Lamentablemente, no es un hecho reciente.
Scott Mitchell
correcto. Es por eso que me inclino hacia un equipo defectuoso en lugar de calor, ya que el calor no debería haber sido un problema cuando lo construyó por primera vez (a menos que el equipo esté muy caliente para empezar)
Xantec
El calor podría haber sido un problema cuando se construyó el sistema. Una vez recibimos una estación de trabajo de doble procesador de un fabricante importante con los ventiladores del procesador conectados a los pines del ventilador de la placa madre del otro procesador. ... Pero no es probable que el problema en este caso.
Mike Chess
1

Pasé por este proceso el año pasado.

Lo primero es determinar si es hardware o software. Eso significa ejecutar dos sistemas operativos diferentes en él. En mi caso, mi instalación principal fue Linux, y se congeló al azar, similar a lo que usted describe. A veces cada 5 minutos, otras veces duraría varios días.

Finalmente instalé Windows en él, que experimentó los mismos problemas. Cuando reinicié y se colgó durante la publicación, devolví el MB y no he tenido ningún problema desde entonces.

Como parte del proceso de depuración, también probé diferentes controladores de video: los controladores genéricos no acelerados no se congelaron con tanta frecuencia. También instalé temp. monitoreó las utilidades y revisó los registros para ver si sucedía algo común antes del congelamiento. Como se trataba de hardware y aparentemente aleatorio, nunca encontré ninguna forma de causar el problema de manera confiable, pero ese debería ser su objetivo.

Chris
fuente
No estoy exactamente seguro de lo que estás sugiriendo aquí.
James Mertz
Si se trata de un problema con el hardware, el problema estará presente independientemente del sistema operativo. Si solo aparece con un sistema operativo, y no con otro, entonces lo más probable es que sea un software.
Chris
1
@chris: El problema ha existido desde que construí la computadora. Inicialmente estaba usando Windows Server 2003, luego actualicé a Windows 7. Con ambos sistemas operativos, he experimentado estos bloqueos.
Scott Mitchell
@Scott: ¿también monitorea las temperaturas de la GPU? Si varios sistemas operativos experimentan el mismo problema, me inclinaría por el hardware, aunque supongo que ambos están usando el mismo controlador de video. ¿Has intentado quitar una de las tarjetas de video y ver si puedes reducirla a una tarjeta específica?
Chris
1
Bueno, si asumes que no son las tarjetas de video, entonces eso deja memoria, placa base o software. Si descarta el software debido a que ve el problema con Win7 y Win2003 (lo cual no haría), eso deja memoria o MB. ¿Puedes cambiar la RAM?
Chris
1

Sospecharía primero la fuente de alimentación. Intente reemplazarlo con una unidad de mayor potencia y vea si las cosas se vuelven más estables. Puede ser que los rieles de voltaje se inclinen un poco bajo carga, lo que explica por qué se muestra con más frecuencia con la reproducción de video.

Para probar esta teoría, necesitará un voltímetro preciso y algunas habilidades eléctricas básicas, pero dado lo útil que es una fuente de alimentación de repuesto, estaría tentado a cambiarlo y verlo.

Cínico óptimo
fuente
1

Según su actualización n. ° 3 y un bloqueo a 38 ° C, el calor mobo / cpu no es la causa principal. Suponiendo que solo tiene las tarjetas de video agregadas y ninguna otra tarjeta adicional (¡alguna vez tuve la oportunidad de hacer esto!), Hago estas recomendaciones en orden de lo que creo que es la causa más probable:

  • Reemplace las tarjetas de video con una tarjeta buena conocida diferente para solucionar problemas. Compre uno, pídalo prestado, lo que sea. Si eso no soluciona, pase a la siguiente viñeta.

  • Usted mencionó actualizar el controlador de la tarjeta de video, pero ninguno más. Asegúrese de que todos los controladores posibles estén actualizados. Tuve una tarjeta nic para hacer esto una vez y todo lo que tuve que hacer para arreglar fue actualizar el controlador.

  • Si realmente no tiene ningún otro complemento en las tarjetas (si las tiene, retírelas ahora), desactive todos los equipos opcionales en la BIOS. Con eso me refiero a tu sonido a bordo, lan y saca cualquier elemento usb. Luego, mira si desaparece.

Me arriesgaré y diré que estoy 90% seguro de que se solucionará con la viñeta n. ° 1.

Flotsam N. Jetsam
fuente
1

Probablemente un problema con la tarjeta de video, reemplazó muchos 8600GT (G84). Fue un gran fracaso por parte de NVIDIA, especialmente. en la computadora portátil (8x00M) serie.

La temperatura de la GPU de 65 ° C parece demasiado alta si estaba inactiva.

Ejecute una prueba de quemado de cinco minutos con Furmark; si se cuelga, la tarjeta de video es la culpable.

Problemas https://en.wikipedia.org/wiki/GeForce_8_Series#Problems

Furmark http://www.ozone3d.net/benchmarks/fur/

nomen_n
fuente
0

Parece que el hardware o los controladores son el problema aquí. Aunque estaría inclinando el hardware ya que has tenido dos sistemas operativos diferentes en la computadora.

Trabajando en esa suposición, comience con las cosas más fáciles. Vi que ejecutaste Memtest y, aunque eso es genial, no necesariamente descarta que la memoria sea sospechosa. Por lo tanto, intente lo siguiente: saque todas las memorias menos una y vea si obtiene un bloqueo. Si funciona bien durante un tiempo, coloque uno más y así sucesivamente hasta que vuelva a tener el problema. Si todavía se bloquea, pruebe con un palo diferente en una ranura diferente. Si aún se está bloqueando, entonces muévase a otros componentes de hardware.

Algunas personas mencionaron tratar de cambiar su tarjeta de video y estoy de acuerdo. Compre uno barato o pídalo prestado a un amigo y pruébelo. Haga lo mismo con una fuente de alimentación. Su fuente de alimentación parece una decente, pero van mal y vale la pena cambiarla y ver si eso soluciona su problema.

Si todo esto falla, yo diría que reemplace la placa base. Especialmente desde que dijiste que has tenido el problema desde la primera vez que obtuviste la computadora.

Una última cosa para verificar es estar seguro. Haga una prueba chkdsk / SMART en sus discos duros. Probablemente estén bien, pero vale la pena revisar de todos modos.

Nori
fuente
0

Según su descripción, parece que el problema está en la placa base. Podría ser que su Northbridge tenga un problema ( diagrama de la placa base ). Lo que también verificaría es la configuración del BIOS para el generador de reloj y la velocidad de la CPU. (No conozco su placa base, pero tal vez tiene algunas características de overclocking). Quizás los problemas siempre suceden cuando hay una carga alta y la CPU intenta funcionar más rápido.

Raffael
fuente
0

Voy por un ala aquí y sugiero que el culpable es un condensador quemado que no puede suministrar una carga eléctrica para suavizar los errores de fluctuación de corriente. Supongo que una fluctuación lo suficientemente significativa hará que el sistema se congele pero permanezca encendido.

Según la experiencia pasada, atribuiría la culpa a un condensador quemado en su unidad de fuente de alimentación (PSU), pero sugeriría verificar todos los condensadores en su computadora, dentro y alrededor de la placa base, particularmente alrededor del puente norte. Si ha estado sobre reloj, es probable que la placa base haya sido frita. Aunque es poco probable que algún condensador se haya fundido bajo disipadores de calor, también puede ser una posibilidad.

Si no encuentra nada quemado en la placa base, le garantizaría su fuente de alimentación, ya que algunas tienen una garantía larga, la mía de 7 años, así que no la abra para inspeccionarla a menos que sepa que está fuera de garantía. Una fuente de alimentación decente puede ser reparable con las herramientas adecuadas si solo se trata de un condensador.

Jonathan
fuente
-1

He manejado muchas situaciones como esta, y el problema más común que encontré con los bloqueos o la congelación fue la pasta de disipador de calor. Su ventilador puede hacer lo que quiera, pero si se permite un espacio de aire entre el disipador de calor y la CPU, el disipador de calor no enfriará el aire entre los dos. Si esa pasta está demasiado seca o en lugares donde se supone que no debe ser o no es suficiente o no permite una conexión de calor conductiva entre el procesador y el fregadero, se bloqueará porque está activando un circuito de protección del procesador en el procesador mismo. . Hazlo cinco o seis veces hasta que ese problema desaparezca. Eventualmente lo hará, o desecharemos su procesador y le enviaremos uno nuevo sin siquiera decirle. No queremos reemplazar su CPU. Lo hacemos 10 veces antes de hacerlo.

Relevante pero no puedo decirte
fuente
1
Puedo creer que podrías saber de lo que estás hablando, pero no puedo entender lo que estás diciendo. Por favor, editar su respuesta para aclarar - Te he dado un comienzo. Por ejemplo: "Hazlo cinco o seis veces ..." –– ¿qué haces? "Lo hacemos 10 veces ..." - ¿hacer qué y quiénes somos "nosotros"? Además, aclare lo que está diciendo que Sathya ♦ ya no dijo en su comentario el 10 de diciembre de 2010 a las 21:36 .
Scott
-1

Puede ser un problema del controlador: cada vez que esté a punto de manejar su video, lo más probable es que se bloquee (también puede hacer un ruido extraño) porque su pantalla se está congelando, la CPU aún puede funcionar, de hecho todo podría estar funcionando. simplemente no podrá ver los resultados de las manipulaciones de su mouse / teclado, porque una vez que su controlador falla, no hay nada para manejar las representaciones visuales de las entradas.

Posible solución: Actualice el controlador, si comenzó cuando actualizó un controlador, vuelva al controlador anterior, si su tarjeta gráfica es antigua, intente comprar una nueva, a veces cuando las tarjetas antiguas se reparan con controladores nuevos, pueden tener errores.

El sobrecalentamiento es realmente un problema solo cuando su tarjeta funciona con el 110% de su potencia fabricada, puede causar un bloqueo, pero de nuevo SI solo la aumentó mucho.

Enariel
fuente
Es una suposición, aunque decente. Pero también podría ser energía, un componente individual que falla, calor en algún lugar además de la CPU (GPU, disco duro) También podría ser una mala instalación.
Austin T French
-2

Estoy de acuerdo con Nori en hacer una prueba SMART. Use (la edición gratuita) HDTune para copiar los atributos SMART. También haga un escaneo de errores. Un solo sector dañado puede causar los problemas que está describiendo. El sobrecalentamiento generalmente causa BSOD y un reinicio forzado o apagado. Como se está "congelando", me parece más un problema de disco duro (aunque los discos duros defectuosos también pueden causar BSOD).

Verifique el estado INTELIGENTE y tome nota de los datos del "Recuento de horas de encendido". Si el recuento no aumenta después de unas pocas horas, los atributos SMART probablemente se congelen y le darán un falso estado "OK".

También revise los registros de eventos del sistema y la aplicación de Windows en busca de errores.

(panel de control -> Herramientas administrativas -> Gestión informática -> Visor de eventos)

Asegúrese de tener una copia de seguridad de todos sus datos importantes.

James T
fuente
Los problemas de disco casi siempre empeoran con el tiempo, lo cual no es el caso de la descripción.
Flotsam N. Jetsam
@Flotsam Buen punto. Un disco duro escamoso probablemente estaría muerto después de unos años. Quizás un controlador RAID escamoso entonces. Los registros de eventos aún podrían proporcionar algunas buenas pistas.
James T
No es un consejo terrible, pero no en el acto para esta configuración y los síntomas descritos.
Ярослав Рахматуллин