En mi tiempo libre, estoy trabajando en un pequeño sistema basado en la web que recopila informes de fallas (pero no otros informes de fallas que no se bloquean) que se envían desde las aplicaciones de Delphi para Windows.
Para la resolución de problemas, a los usuarios les encantaría tener una función de minería de datos para encontrar relaciones entre las versiones de hardware o sistema operativo y el error y / o bloqueo específico.
Como ejemplo de cómo debería funcionar esto:
- Para cada bloqueo hay un informe en la base de datos, que tiene un código de huella digital / hash del seguimiento de la pila (pila de llamadas) en el momento del bloqueo para identificar duplicados
- el algoritmo verifica si todos los duplicados de un informe de error también tienen otros atributos comunes, por ejemplo, un paquete de servicio faltante del sistema operativo
- el resultado del análisis enumera todas las propiedades que tienen en común los informes de errores
Supongamos que estos informes automáticos de errores contienen toda la información clave, como los nombres de todos los procesos que se están ejecutando actualmente, los nombres de archivo, la información de versión de las DLL cargadas, etc.
¿Cómo puedo encontrar correlaciones entre accidentes repetidos y el medio ambiente? ¿Existen algoritmos específicos o métodos estadísticos que podrían ayudar?
Respuestas:
¿Podría probar las máquinas [no bloqueadas] de su usuario para obtener la misma información que obtiene en un informe de bloqueo? Porque entonces podría usar la regresión logística para modelar esos atributos (e interacciones) a la probabilidad de sufrir un bloqueo.
fuente