El registro de eventos de la aplicación se corrompe

8

Recientemente pregunté sobre la reparación de un registro de eventos corruptos , porque parecía ser un evento único. Desde entonces, el registro de eventos ha exhibido el mismo comportamiento 3 veces. Hemos estado tratando de encontrar patrones, pero hasta ahora no hemos encontrado nada. El servidor ejecuta varias aplicaciones ASP.NET y tres tareas programadas escritas en .NET. La última fecha de modificación del registro de eventos una vez fue la misma hora que una de las tareas programadas, pero las otras no lo han sido.

¿Alguna sugerencia sobre dónde buscar a continuación o cómo podemos obtener información de un archivo evtx corrupto?

El servidor ejecuta aplicaciones críticas de comercio electrónico, por lo que queremos mantener al mínimo la cantidad de reinicios necesarios.

Editar: me encontré DUMPEL y obtuve resultados muy extraños.

1/9/2012    4:14:05 PM  1   100 1000    Application Error       N/A SERVERNAME  Faulting application name: w3wp.exe, version: 7.5.7601.17514, time stamp: 0x4ce7a5f8  Faulting module name: ntdll.dll, version: 6.1.7601.17514, time stamp: 0x4ce7ba58  Exception code: 0xc0000374  Fault offset: 0x000ce653  Faulting process id: 0x1070  Faulting application start time: 0x01cccf1386d30991  Faulting application path: C:\Windows\SysWOW64\inetsrv\w3wp.exe  Faulting module path: C:\Windows\SysWOW64\ntdll.dll  Report Id: dbf4f691-3b06-11e1-9025-005056a602e6  
1/9/2012    4:14:07 PM  4   0   1001    Windows Error Reporting N/A SERVERNAME  Fault bucket , type 0  Event Name: APPCRASH  Response: Not available  Cab Id: 0    Problem signature:  P1: w3wp.exe  P2: 7.5.7601.17514  P3: 4ce7a5f8  P4: StackHash_79d9  P5: 6.1.7601.17514  P6: 4ce7ba58  P7: c0000374  P8: 000ce653  P9:   P10:     Attached files:  C:\Windows\Temp\WER975.tmp.appcompat.txt  C:\Windows\Temp\WERA03.tmp.WERInternalMetadata.xml  C:\Windows\Temp\WERA13.tmp.hdmp  C:\Windows\Temp\WERD21.tmp.mdmp    These files may be available here:  C:\ProgramData\Microsoft\Windows\WER\ReportQueue\AppCrash_w3wp.exe_cd7d09dfc84119d82a2ac6a789038bd5661acfb_cab_128f0e67    Analysis symbol:   Rechecking for solution: 0  Report Id: dbf4f691-3b06-11e1-9025-005056a602e6  Report Status: 4  
1/9/2012    4:14:07 PM  4   0   1001    Windows Error Reporting N/A SERVERNAME  Fault bucket , type 0  Event Name: APPCRASH  Response: Not available  Cab Id: 0    Problem signature:  P1: w3wp.exe  P2: 7.5.7601.17514  P3: 4ce7a5f8  P4: StackHash_79d9  P5: 6.1.7601.17514  P6: 4ce7ba58  P7: c0000374  P8: 000ce653  P9:   P10:     Attached files:  C:\Windows\Temp\WER975.tmp.appcompat.txt  C:\Windows\Temp\WERA03.tmp.WERInternalMetadata.xml  C:\Windows\Temp\WERA13.tmp.hdmp  C:\Windows\Temp\WERD21.tmp.mdmp    These files may be available here:  C:\ProgramData\Microsoft\Windows\WER\ReportQueue\AppCrash_w3wp.exe_cd7d09dfc84119d82a2ac6a789038bd5661acfb_cab_128f0e67    Analysis symbol:   Rechecking for solution: 0  Report Id: dbf4f691-3b06-11e1-9025-005056a602e6  Report Status: 0  
1/9/2012    4:14:12 PM  1   100 1000    Application Error       N/A SERVERNAME  Faulting application name: w3wp.exe, version: 7.5.7601.17514, time stamp: 0x4ce7a5f8  Faulting module name: ntdll.dll, version: 6.1.7601.17514, time stamp: 0x4ce7ba58  Exception code: 0xc0000374  Fault offset: 0x000ce653  Faulting process id: 0x16ac  Faulting application start time: 0x01cccf139f475c0c  Faulting application path: C:\Windows\SysWOW64\inetsrv\w3wp.exe  Faulting module path: C:\Windows\SysWOW64\ntdll.dll  Report Id: e03bae70-3b06-11e1-9025-005056a602e6  
1/9/2012    4:14:16 PM  4   0   1001    Windows Error Reporting N/A SERVERNAME  Fault bucket , type 0  Event Name: APPCRASH  Response: Not available  Cab Id: 0    Problem signature:  P1: w3wp.exe  P2: 7.5.7601.17514  P3: 4ce7a5f8  P4: StackHash_9c6c  P5: 6.1.7601.17514  P6: 4ce7ba58  P7: c0000374  P8: 000ce653  P9:   P10:     Attached files:  C:\Windows\Temp\WER2579.tmp.appcompat.txt  C:\Windows\Temp\WER25F7.tmp.WERInternalMetadata.xml  C:\Windows\Temp\WER25F8.tmp.hdmp  C:\Windows\Temp\WER28F6.tmp.mdmp    These files may be available here:  C:\ProgramData\Microsoft\Windows\WER\ReportQueue\AppCrash_w3wp.exe_c49a67649524ad11b64bbf809211bc5ba742a3d6_cab_0b63321b    Analysis symbol:   Rechecking for solution: 0  Report Id: e03bae70-3b06-11e1-9025-005056a602e6  Report Status: 4  
1/9/2012    4:14:16 PM  4   0   1001    Windows Error Reporting N/A SERVERNAME  Fault bucket , type 0  Event Name: APPCRASH  Response: Not available  Cab Id: 0    Problem signature:  P1: w3wp.exe  P2: 7.5.7601.17514  P3: 4ce7a5f8  P4: StackHash_9c6c  P5: 6.1.7601.17514  P6: 4ce7ba58  P7: c0000374  P8: 000ce653  P9:   P10:     Attached files:  C:\Windows\Temp\WER2579.tmp.appcompat.txt  C:\Windows\Temp\WER25F7.tmp.WERInternalMetadata.xml  C:\Windows\Temp\WER25F8.tmp.hdmp  C:\Windows\Temp\WER28F6.tmp.mdmp    These files may be available here:  C:\ProgramData\Microsoft\Windows\WER\ReportQueue\AppCrash_w3wp.exe_c49a67649524ad11b64bbf809211bc5ba742a3d6_cab_0b63321b    Analysis symbol:   Rechecking for solution: 0  Report Id: e03bae70-3b06-11e1-9025-005056a602e6  Report Status: 0  
1/9/2012    4:14:21 PM  1   100 1000    Application Error       N/A SERVERNAME  Faulting application name: w3wp.exe, version: 7.5.7601.17514, time stamp: 0x4ce7a5f8  Faulting module name: ntdll.dll, version: 6.1.7601.17514, time stamp: 0x4ce7ba58  Exception code: 0xc0000374  Fault offset: 0x000ce653  Faulting process id: 0x17f8  Faulting application start time: 0x01cccf13a4ba5126  Faulting application path: C:\Windows\SysWOW64\inetsrv\w3wp.exe  Faulting module path: C:\Windows\SysWOW64\ntdll.dll  Report Id: e57a0a85-3b06-11e1-9025-005056a602e6  
1/9/2012    4:14:21 PM  4   0   1001    Windows Error Reporting N/A SERVERNAME  Fault bucket , type 0  Event Name: APPCRASH  Response: Not available  Cab Id: 0    Problem signature:  P1: w3wp.exe  P2: 7.5.7601.17514  P3: 4ce7a5f8  P4: StackHash_9c6c  P5: 6.1.7601.17514  P6: 4ce7ba58  P7: c0000374  P8: 000ce653  P9:   P10:     Attached files:    These files may be available here:  C:\ProgramData\Microsoft\Windows\WER\ReportQueue\AppCrash_w3wp.exe_c49a67649524ad11b64bbf809211bc5ba742a3d6_1cfb4872    Analysis symbol:   Rechecking for solution: 0  Report Id: e57a0a85-3b06-11e1-9025-005056a602e6  Report Status: 4  
1/9/2012    4:14:21 PM  4   0   1001    Windows Error Reporting N/A SERVERNAME  Fault bucket , type 0  Event Name: APPCRASH  Response: Not available  Cab Id: 0    Problem signature:  P1: w3wp.exe  P2: 7.5.7601.17514  P3: 4ce7a5f8  P4: StackHash_9c6c  P5: 6.1.7601.17514  P6: 4ce7ba58  P7: c0000374  P8: 000ce653  P9:   P10:     Attached files:    These files may be available here:  C:\ProgramData\Microsoft\Windows\WER\ReportQueue\AppCrash_w3wp.exe_c49a67649524ad11b64bbf809211bc5ba742a3d6_1cfb4872    Analysis symbol:   Rechecking for solution: 0  Report Id: e57a0a85-3b06-11e1-9025-005056a602e6  Report Status: 0  

Ninguno de los archivos a los que se hace referencia existe realmente (ni siquiera en WER ReportArchive). Estos no deberían ser los únicos eventos mencionados. El archivo de registro se ha borrado dos veces desde el 9 de enero, por lo que esos eventos ni siquiera deberían aparecer en la lista.

Actualización (2016-06-14):
ya no tenemos este servidor y, por lo tanto, ya no podemos probar las soluciones propuestas. Nunca descubrimos qué estaba mal, pero desde entonces trasladamos todos nuestros servicios a nuevos servidores.

yakatz
fuente
Mi primer paso sería intentar replicar esto en un entorno no prod. ¿Puede configurar otro servidor con las mismas aplicaciones y ver si vuelve a ocurrir, o configurar una copia de VM?
Sam Cogan
@ Sam Estoy tratando de buscar los recursos necesarios para eso.
yakatz
¿Encontraste una solución? por favor conteste su propia pregunta. Gracias
MacGyver
2
@Leandro no encontramos una solución, pero parece haber dejado de suceder recientemente por sí solo.
yakatz
¿Ha cambiado el código en el grupo de aplicaciones desde que esto ocurrió originalmente? El resultado de dumpel sugiere que uno de los grupos de aplicaciones se estaba bloqueando y los informes de errores estaban verificando con MS el estado de ese bloqueo en particular. Supongo que hubo una excepción no detectada en el código que estaba bloqueando el grupo de aplicaciones y que se ha solucionado.
Nathan V

Respuestas:

1

Sorprendido, esto no se ha mencionado antes; ¿Has verificado el sistema de archivos? Si es un disco local, y puede absorber el tiempo de inactividad, marcar el volumen para un chkdsk y reiniciar. Haga un escaneo de superficie si es posible.

Tenga en cuenta que esto llevará mucho tiempo. Especialmente en un volumen grande (+ 50gb). Dispara un fin de semana si es posible.

Señal15
fuente
En realidad es una máquina virtual, por lo que no tenemos acceso al disco físico.
yakatz
44
El hecho de que sea una VM es irrelevante. Es posible que tenga daños en el sistema de archivos. Ejecute un 'chkdsk' durante su próximo intervalo de inactividad / mantenimiento.
Señal15
0

Parece que puede tener un problema con la corrupción del sistema de archivos; una buena manera de verificar esto sin tener que reiniciar es ejecutar:

sfc /scannow

Y vea si obtiene una multitud de correcciones o errores. Si lo hace, el mejor siguiente paso es reiniciar para ejecutar un chkdsk para reparar sus particiones y corregir cualquier error en ellas. Después de eso, si todavía tiene problemas, es posible que deba hablar con su proveedor sobre el hardware subyacente.

rtw
fuente
Este servidor virtual ya no existe, así que no puedo probar nada nuevo con esta pregunta, pero sé que el sistema de archivos estaba bien y que habíamos ejecutado sfcantes y no habíamos recibido ningún error.
yakatz