Estoy buscando sugerencias, consejos y respuestas sobre cómo comenzar a solucionar problemas cuando:
- El problema es intermitente.
- El problema podría estar literalmente en cualquier parte: sistema operativo; software de fuente libre; mis propios desarrollos de software; software comprado; migas en el teclado; la combinación específica de software que estoy ejecutando actualmente; El demonio de Maxwell; los pequeños hombres azules que realmente manejan la máquina se han puesto en huelga; etc.
- Tengo experiencia solo en algunas de las áreas que son candidatos potenciales para la causa del problema.
El problema específico que tengo se detalla a continuación como ejemplo, pero no estoy buscando respuestas a mi problema actual, sino más bien dónde y cómo comenzar a abordar tales problemas.
Actualmente encuentro un problema con mi nueva máquina. En algunas ocasiones la máquina se ha congelado; no acepta pulsaciones de teclas, clics del mouse ni nada, excepto el interruptor de encendido / apagado. Invariablemente, he estado simplemente navegando por la web; He tenido algunas (<= 6 otras aplicaciones) ejecutándose. Ninguna de estas aplicaciones es importante; y representan una combinación de programas comerciales y programas de código abierto, típicamente migrados de Unix de alguna variedad.
Mi máquina es una computadora portátil Windows 7 I7 quad core.
EDITAR:
Aunque dije que la descripción real del problema era solo un ejemplo, algunos de los comentarios se concentran en resolver este problema. Desafortunadamente, como era solo un ejemplo, la información dada es correcta pero no completa. Para evitar que la gente pierda su tiempo intentando, de forma remota, ayudar con el problema real, estoy dando otra información sobre mi configuración. Como dije originalmente, no estoy buscando respuestas a este problema específico.
Mi máquina es una computadora portátil de alta potencia; es mi máquina principal se utiliza para el desarrollo y redacción técnica, comunicaciones - correo electrónico, web, FTP, etc., y para edición e indexación de fotos. Un conjunto riguroso y extenso de programas de prueba de hardware, que incluye pruebas de CPU, múltiples pruebas de memoria y pruebas en todos los demás componentes, se ejecuta al menos una vez al mes. También se ejecuta al menos mensualmente un análisis completo de virus; un escaneo completo de spyware; una limpieza de disco; y una desfragmentación de disco.
El disco contiene aproximadamente 3 * 10 ^ 6 archivos; el uso del disco es de 300 Gb, dejando 150 Gb libres. La memoria es de 8 Gb. Si bien la máquina puede calentarse un poco cuando estoy ejecutando un complemento completo de las principales herramientas de desarrollo, he encontrado el problema solo cuando utilizo la máquina muy ligeramente: navegación web más Textpad más Graphviz más una base de datos Firebird más un navegador de base de datos liviano (Flame Robin ) En estas circunstancias, incluso el ventilador no está ligeramente caliente. No he realizado cambios en el software, el sistema operativo o el hardware durante el período en que me encontré con el problema. Se han producido una serie de actualizaciones automáticas: Microsoft, Adobe y Lenovo principalmente, pero no exclusivamente.
Este fondo pone en contexto (espero) mis razones para hacer esta pregunta de la manera que lo hice. Ahora voy a comenzar a investigar los diversos registros mencionados en las respuestas como un primer paso para tratar de reducir el campo de investigación. Y voy a intentar un ejercicio una de las características sugeridas en las respuestas que he recibido hasta ahora, paciencia, en mi investigación.
Respuestas:
Ten una mejor idea.
No vas a ganar una batalla sin suficiente información de campo.
Describa su problema en detalle para que tenga una buena idea de él, quién sabe que solo sucede una vez.
Rastree en el tiempo lo que sucedió antes y junto con el problema, tanto usted como su computadora.
Piense en las posibles causas porque a veces puede ser algo que no es obvio.
Obtenga más información cada vez que no tenga idea de lo que está sucediendo, esto podría abarcar desde Eventos , Herramientas SysInternals , Análisis de rendimiento , Depuración y cualquier otra herramienta en su experiencia .
Pon a prueba tus suposiciones para asegurarte de que tus pensamientos no filtren la causa.
Divide y conquistaras.
Porque así es como los militares derrotan a su oponente incluso cuando son superados en número.
Elimine las posibles causas, o tendrá un problema para realizar un seguimiento del problema. De esta manera, se acercará cada vez más a la causa raíz del problema, le permite resolver el problema mucho más fácilmente.
Por ejemplo, con hardware , desconecte y elimine todo lo que no necesite para solucionar su problema. De esta manera, puede desconectar el componente que causa el problema. Y luego nuevamente se trata de insertar la mitad de los componentes, verificar si se repite y repetir la división hasta que tenga el componente defectuoso ...
Probar algo en otra computadora, si está disponible, también es un buen beneficio para resolver el problema.
Por ejemplo, con el software , reiniciar en modo seguro, deshabilitar las entradas de inicio también ayuda. Esto también se aplica a habilitar / deshabilitar la configuración, probar la configuración predeterminada, etc.
Pongámoslo a prueba.
Esa es una descripción adecuada en sí misma, no solo sucede una vez tampoco.
Usted sabe lo que sucedió junto con el problema,
pero no ha pensado en las cosas que usted o su computadora hicieron antes del problema .
No puedo decir esto, pero usted, su registro de eventos y los archivos / carpetas modificados recientemente podrían decirlo.
La causa más probable es que esté relacionada con la CPU , porque es el componente que procesa las cosas.
Más específicamente, esto podría ser un proceso, un controlador o un hardware defectuoso (¿quizás problemas de temperatura?).
Sé que es CPU, pero no sé qué. Los eventos no muestran esto, Process Explorer se colgaría en DPC .
Entonces, el siguiente paso, dejo que se ejecute el análisis de rastreo que cierro después de que se ha producido el bloqueo.
¡Miro el rastro y veo que el controlador X está causando el problema !
No se hacen suposiciones reales. La suposición de la CPU se maneja mediante nuestro enfoque Divide & Conquer ...
Entonces, aquí es donde empiezo a dividir para conquistar el problema, me detengo una vez resuelto:
¿Problema con la versión actual del controlador?
Actualice el controlador a la última versión.
¿Problema con las versiones más recientes del controlador?
Consigue un nuevo rastro. Actualice el controlador a una versión anterior diferente de la inicial.
Problema con el dispositivo? ¿Problema de configuración en el registro?
Consigue un nuevo rastro. Vuelva a instalar y / o desactive el dispositivo si es posible.
El problema es aleatorio, ¿se está calentando el procesador?
Verifique la temperatura del procesador, reemplace el ventilador si es necesario.
El problema no es el procesador, ¿hay otras influencias de hardware y software?
Elimine el hardware y desactive la ejecución del software para determinar la influencia de terceros.
El problema no está en una parte extraíble, debe reemplazarse.
En el peor de los casos, si todo lo demás falla, debe buscar un reemplazo.
Obtener nuevos rastros y eliminar hardware nos brinda más información, por lo que sabemos dónde buscar a continuación.
fuente
Buenos registros e intuición, de verdad.
fuente
C:\Windows\*.log
,C:\Windows\Logs
,C:\Windows\inf\*.log
yPerformance Monitor > Data Collector Sets > (Startup) Event Trace Sessions
. Además, @JRobert, +1 por explicar cómo obtener una idea con más detalle ...Por lo general, comienzo con los registros de eventos y cualquier registro que un programa pueda crear por sí solo. Los programas a veces crean un registro en la carpeta del programa.
Una vez que pueda identificar la hora, busque eventos en los registros. Naturalmente, los registros de Windows pueden presentar errores de detención que serán fáciles de identificar.
Verifique todos los controladores y asegúrese de que estén actualizados.
Probablemente se requerirá paciencia en grandes dosis.
fuente
Además de todos los buenos consejos ya dados, si los archivos de registro no le dan mucho para seguir, a menudo vale la pena realizar una prueba de memoria adecuada de la máquina: la memoria defectuosa puede causar todo tipo de extraños bloqueos y bloqueos intermitentes. La prueba de memoria integrada es mucho más parecida a un conteo de memoria, es extremadamente raro que la prueba de encendido detecte un fallo de memoria.
Diagnóstico de memoria de Google para Windows y grabarlo en un CD. Es viejo, pero es una de las mejores pruebas de memoria, y es gratis.
fuente