¿Cuáles son las causas comunes de falla de la CPU?

12

¿Cuáles son las causas más comunes de falla de la CPU?

¿Hay estados intermedios entre una CPU que funciona perfectamente y una muerta?

InquilineKea
fuente
1
Las causas comunes incluyen calor y voltajes incorrectos. Por lo tanto, asegúrese de que su computadora esté bien enfriada y de que tenga una buena fuente de alimentación y una buena protección de energía. El enfriamiento será deficiente si sus computadoras tienen demasiado polvo.
Zoredache

Respuestas:

9

Es posible que solo requiera que falle un transistor antes de que una CPU deje de funcionar, y dado que hay millones de transistores en una CPU moderna, puede preguntarse por qué no sucede con más frecuencia.

Y, dependiendo de dónde se encuentre el transistor en la CPU, el efecto puede ser diferente, pero no creo que podamos esperar una disminución gradual del rendimiento: una falla en la ALU puede no notarse hasta que se ejecute una instrucción en particular, y algunas instrucciones se ejecutarían con menos frecuencia.

Entonces CPUS muere repentinamente cuando falla un transistor. Esto puede deberse a defectos en el chip de la computadora que se estresan demasiado, por lo que el tiempo puede ser un factor.

El calor excesivo puede causar que las diminutas impurezas en el silicio que forman los transistores se difundan y cambien los parámetros de operación. El calor es una consecuencia inevitable de simplemente operar los transistores, por lo que la falta de enfriamiento puede ocasionar fallas.

Otras razones pueden incluir la falla de las interconexiones dentro del paquete del chip de la CPU, pero los fabricantes siempre están buscando métodos de empaque mejorados con interconexiones más confiables y una mejor disipación de calor.

pavium
fuente
2
El calor es, con mucho, la forma más común. Y nunca sabrías que estaba fallando hasta que comiences a tener fallas y errores al azar. La única forma de saber realmente es depurar el kernel. Si su aplicación falla por instrucciones simples y copia de memoria, entonces es un regalo muerto. O eso o estás overclocking demasiado duro :)
surfasb
No llamaría 'fallas' a fallas y errores aleatorios Si el problema desaparece con el enfriamiento, excelente , pero parece que el equipo se estaba operando fuera de sus especificaciones de diseño.
Pavium
Mi punto es que si no estás haciendo overclocking en primer lugar, entonces la alternativa es que tu CPU está fallando. Y no sé acerca de usted, pero si mi computadora falla mientras la CPU está cambiando uno a cero, llamaría a eso una falla. . .
surfasb
Sí, estaba siendo pedante. En el uso común, la computadora falla si no puede realizar operaciones de manera confiable. También debo recordar que cuando la gente habla de una CPU, puede que no se refiera al chip dentro del paquete cuadrado grande. Lo haría , pero esa es una perspectiva profesional.
pavium
Sí, este es SuperUser. CPU! = CU.
surfasb
3

Honestamente, no hay causas comunes de falla de la CPU ... al menos en relación con otras partes de sus computadoras. La CPU es generalmente la parte más confiable de una computadora. Simplemente no fallan tan a menudo.

En cambio, las cosas que debe tener en cuenta para fallar son aquellas con partes móviles: discos duros tradicionales, unidades ópticas y ventiladores. Más recientemente, también necesitamos agregar SSD a esta lista, a pesar de que no tienen partes móviles. Los condensadores también tienen una vida útil limitada, por lo que las fuentes de alimentación y las placas base, que utilizan condensadores, pueden ser sospechosas. A veces también tendrás una mala memoria RAM, pero nunca estoy seguro de por qué se estropean.

Y ahora, por fin, solo después de mirar casi todo lo demás en una computadora, llegamos a la CPU. Incluso cuando ocurre una falla, generalmente es porque el ventilador de enfriamiento (partes móviles nuevamente) se estropeó primero y, como resultado, la CPU se sobrecalentó.

Joel Coehoorn
fuente
1

Entre las otras causas indicadas aquí, también puede haber una conexión interna rota. Se utilizan varias técnicas diferentes para unir los cables internos del "chip" a los cables externos del paquete, y todos estos están sujetos a posibles fallas.

Este tipo de falla posiblemente podría ser el resultado del sobrecalentamiento, y la probabilidad de falla aumenta con los "ciclos térmicos", incluso en ausencia de sobrecalentamiento. La falla puede comenzar de manera intermitente (aunque por lo general resulta en un bloqueo brusco cuando ocurre) pero se vuelve cada vez más persistente a medida que el sistema se reinicia.

Este tipo de falla imita las fallas observadas por conexiones de paquetes / sockets deficientes, etc.

[Agregado:] Y noto que no se han mencionado los "bigotes". Un gran problema con los circuitos integrados y los circuitos impresos muy pequeños son los "bigotes" de metal que crecen fuera del cableado plateado y se acortan entre los "cables" adyacentes. Esto es especialmente un problema cuando se extrae todo el plomo (ver "RoHS"), ya que el plomo se agrega comúnmente a las aleaciones de alambre para evitar las arrugas. Este problema empeora con el aumento de la temperatura, por supuesto.

Daniel R Hicks
fuente
1

En mi experiencia, calor. ¿Cómo por qué? Demasiada pasta térmica! Muchas personas (¿la mayoría?) Saben que necesitan un poco de pasta térmica, pero es posible que no se den cuenta de lo poco que deberían usar.

La regla es usar tanto como el tamaño de un grano de arroz crudo, lo creas o no.

Aunque la pasta es aproximadamente 10 veces mejor que el aire al conducir el calor, el cobre del disipador térmico es 10 veces mejor que la pasta, por lo que desea que esté lo más cerca posible de la CPU. La pasta es realmente solo para rellenar grietas MUY PEQUEÑAS para que el aire no esté allí.

estático
fuente
0

Un artículo interesante sobre el tema de »Transistor Aging« apareció en la revista Spectrum de IEEE ( http://spectrum.ieee.org/semiconductors/processors/transistor-aging ). Enumera varios mecanismos básicos que pueden conducir a la falla de un transistor individual, lo que en efecto puede reducir el poder de cómputo del chip completo al de una papa (o ladrillo).

eMPee584
fuente