Sobrecalentamiento de la computadora portátil después de hacer la rutina de limpieza habitual

8

Tengo una computadora portátil Vaio VGN-CR353 que me dieron alrededor de septiembre u octubre de 2012 e instalé Ubuntu en ella. Ya lo convertí en una computadora portátil muy personal e instalé juegos bajo wine (SC2, Frozen trono), varios IDEs (Sublime Text 2, Eclipse, Netbeans) sin problemas ... hasta noviembre pasado.

Para que lo sepas, nunca toqué las partes internas hasta la última semana de noviembre, cuando determiné que no era el software el que causaba este problema.

Ubuntu informa que con frecuencia alcanza las marcas críticas 95C o 105C y se apaga automáticamente. Ya he abordado el problema:

  • Desempolvó las partes internas. Sorprendentemente, estaba muy limpio para empezar.
  • Se eliminaron acumulaciones muy pequeñas en el ventilador y los sumideros.
  • Ya volví a aplicar el compuesto térmico varias veces, solo por si lo apliqué mal. Actualmente probando diferentes técnicas de aplicación. También eligió nano diamante para descartar cortocircuito debido al compuesto
  • Vuelva a colocar los lavabos con fuerza. El evento dobló un poco los brazos que sostienen el fregadero para asegurarse de que los fregaderos estén lo más apretados posible.
  • Se aseguró de que los respiraderos fueran claros
  • Compré un refrigerador
  • Elevó la computadora portátil comprando "pies de goma" más grandes. La computadora portátil ahora se encuentra al menos a 1 cm de una superficie plana
  • Vuelva a instalar diferentes versiones de Ubuntu ya que los núcleos de Linux de 2.6 a 3.2 sufren un problema de sobrecalentamiento. Actualmente en un kernel 3.5 (Lubuntu 12.10).

Pero aún así, después de abordar estos problemas, el problema del sobrecalentamiento todavía existe. El sobrecalentamiento ocurre cuando:

  • Navego por la red en cualquier navegador (Firefox, Chromium) incluso cuando el complemento flash no está instalado (y, por lo tanto, Flash no tiene la culpa)
  • Copié archivos a un disco duro externo de 39 GB a través del terminal. Inusualmente, no se sobrecalienta cuando se copia usando la GUI.
  • Usando Netbeans, evento cuando solo escribes el código, ni siquiera compilando todavía.
  • Al azar!
  • Incluso cuando estoy en el laboratorio de computación de la escuela, que está muy frío.
  • Después de una instalación limpia de Windows

Limitaciones:

  • No hay configuraciones de BIOS para ventiladores ni configuraciones de frecuencia para procesadores (es Sony, ¿qué esperas?)
  • Los sensores mm no detectan los sensores del ventilador ni ningún otro sensor además de los núcleos de la CPU y la placa base, porque las computadoras portátiles Vaio notoriamente no implementan tales.

Ya instalé sensores lm y gkrellm para controlar las temperaturas. Actualmente tengo una vista de los núcleos de CPU y las temperaturas ACPI. Inusualmente, nunca los vi ir más allá de 60C. Actualmente, las últimas lecturas en temperatura oscilan entre 32 ° C en el arranque nuevo, 43 ° C a temperatura ambiente, 49 ° C en carga moderada (navegación con múltiples pestañas) y 53 ° C cuando se utiliza Netbeans. Es bastante extraño que las temperaturas fluctúen con grandes diferencias entre cada uso.

Además, a veces el sistema informa haber alcanzado las temperaturas críticas incluso cuando la computadora portátil no se siente caliente, como hace un tiempo en el laboratorio.

Hasta ahora, todavía estoy librando esta guerra con la computadora portátil. ¿Me estoy perdiendo una rutina vital que podría cambiar las cosas y de una vez por todas solucionar este problema? Me estoy quedando sin ideas.

Actualización1:

Actualmente estoy descargando controladores para otra computadora portátil a través de Firefox. El uso de la CPU es del 80% y del 21% con temperaturas de 58 ° C y 51 ° C en ambos núcleos. Temperatura ACPI a 60C y uso del disco (escritura debido a la descarga) hasta 205KB / s. Uso de carnero aprox. 500MB. Sin sobrecalentamiento todavía.

Actualización2:

Justo antes de ejecutar Prime95, ya probé la instalación y el uso de Windows durante un par de días. Lo mismo sucede en Windows. La única diferencia es que, a diferencia de Linux, que apaga la máquina de forma semi-adecuada, en Windows, ¡simplemente se apaga! Es como tirar del enchufe de repente.

Por lo tanto, no es un problema de Linux.

Actualización3:

Gestionado para obtener y ejecutar Prime95 en Linux. Sorprendentemente, incluso podría llevar la computadora portátil al 100% de carga en ambos núcleos, usar el 100% de la memoria y alcanzar ~ 90C estable y sin pasar (probado durante 10-15 minutos) sin sobrecalentamiento. Me pregunto por qué la máquina de repente informa 95C y 105C.

Actualización4:

Desmontó la computadora portátil para una limpieza a fondo y luego la volvió a montar. Nada fuera de lo común, solo una pequeña capa de polvo. Después de eso, ejecuté Prime95 durante 30 minutos para demostrar que la computadora portátil no puede sobrecalentarse. Incluso supera a lo sumo 91 * C, promedio en 85 * C. Debe ser un sensor defectuoso.

Actualización 5: Finalmente ejecutó una secuencia de comandos que monitorea las temperaturas en un gráfico de registro, en lugar de solo ver cómo suben las temperaturas actuales. Modifiqué el script en esta publicación para monitorear el ACPI (como lo hace GKrellM), los núcleos y las temperaturas de HDD en mi equipo por segundo . Y luego usé la computadora portátil en diferentes escenarios, como navegación, compilación de código, modo de bajo consumo, modos equilibrado y alto.

Luego de un descubrimiento sorprendente, ¡el sensor ACPI se dispara a crítico en una fracción de segundo! Este evento activa la protección térmica del sistema operativo que apaga la PC. Tengo un registro de las temperaturas (ACPI, Core1, Core2, HDD) y la Advertencia crítica de /var/log/syslog. También tengo un gráfico del registro que hice. Puede ver que en este registro por segundo, aparece a 111 Celsius, fuera de su rango de 40-50. No solo eso, prácticamente no hay nada que lo esté causando. Como puede ver en el registro y el gráfico, el HDD y los núcleos están funcionando bien. Es el ACPI que se ha vuelto loco.

Por cierto, las temperaturas "ACPI" provienen de este camino: /sys/class/thermal/thermal_zone0/temp

cheque terminal

verificación gráfica

José
fuente
¿Puedes escuchar a los fanáticos girar bien? ¿Aceleran y giran a RPM máximas justo antes de que la computadora falle?
terdon
@terdon No sé sobre una velocidad máxima. Intenté mirar el ventilador mientras la cubierta inferior está apagada y el ventilador funciona momentáneamente en el BIOS (tal vez una comprobación), luego se apaga cuando el sistema operativo se carga hasta que carga un escritorio nuevo. Solo se ejecuta nuevamente cuando comienzo a usar aplicaciones, justo cuando comienza a aumentar a alrededor de 40 * C + y se ejecuta constantemente durante el uso. Está soplando aire caliente, por lo que significa que los disipadores están haciendo su trabajo.
Joseph
¿Estás seguro de que los fanáticos incluso están trabajando? Al final, es posible que haya llegado al final de la vida útil de la computadora portátil.
Ramhound
2
Vuelva a prepararlo con Windows y vea si todavía tiene problemas. Si es así, es un problema de hardware; si no, es un problema totalmente sin precedentes con el controlador ACPI de Linux.
Aaron Miller
@Ramhound, sí, estoy seguro de que los fanáticos están trabajando. Giran constantemente en lugar del comportamiento de encendido y apagado de otras computadoras portátiles. Todavía giran cuando el sistema operativo se apaga hasta que se apaga.
Joseph

Respuestas:

3

Han pasado 3 meses y, finalmente, señaló el problema. Es un problema de hardware y ese sitio indio lleno de anuncios con aspecto de spam tenía razón (no lo publicará aquí, ya que es una entidad comercial), es un daño a nivel de chip que es común en una serie de computadoras portátiles Vaio.

Por lo tanto, la mejor y probablemente la única solución es entregarlo al centro de servicio más cercano para su reparación. Si está en garantía, estás bien. Si no, bueno, espere desembolsar algunos dólares por ello. Puede que sea mejor comprar un nuevo cuaderno.


De todos modos, obtuve otra solución y es muy peligroso. Solo estoy compartiendo esto con el propósito de informar que hay una manera de evitarlo, pero tiene sus compensaciones. Este no es un buen consejo, solo afirma que es posible.

Este movimiento peligroso implica deshabilitar el punto crítico de disparo ACPI de Linux. Para hacer esto, uno debe editar su archivo grub:

gksudo leafpad /etc/default/grub

Y agregue thermal.nocrt=-1a GRUB_CMDLINE_LINUX_DEFAULTcomo se muestra:

GRUB_CMDLINE_LINUX_DEFAULT="quiet splash thermal.nocrt=1"

Luego actualice grub:

sudo update-grub

Luego reiniciar.

Esto deshabilita el punto crítico de disparo ACPI pero no el sensor térmico, por lo que aún podemos monitorearlo después.

Después de hacerlo, ejecuté mi script de registrador. Sin embargo, para compensar la falta de un controlador de puntos de disparo natural, configuré a GKrellM para disparar una acción cuando ocurre el evento. Dado que GKrellM generalmente se retrasa, es bueno saber que cuando pasa el punto de disparo, lo ha pasado por una cantidad significativa de tiempo cuando disparo una acción.

Luego seguí con mi rutina habitual. Después de hacerlo, el sistema lo activó nuevamente. Sin embargo, fue un aumento repentino, que ni siquiera se registró en GKrellM, pero mi registrador lo grabó. Es un pico muy abrupto y eso fue todo.

José
fuente
0

Tengo un problema similar con una computadora portátil HP y la respuesta para mí es simplemente que las opciones personalizadas de ahorro de energía o los comandos para el BIOS no funcionan en Linux.

Básicamente, el problema es con Sony y ellos no quieren que sea capaz de ser más que Windows.

Gunnish
fuente
No es un problema de Linux. Ya intenté ejecutar Windows en él y sucede lo mismo.
Joseph
Oh, lo siento, parece un problema más difícil de lo que sabía.
Gunnish