¿Cómo puedo encontrar correlaciones entre bloqueos y entornos del sistema?

10

En mi tiempo libre, estoy trabajando en un pequeño sistema basado en la web que recopila informes de fallas (pero no otros informes de fallas que no se bloquean) que se envían desde las aplicaciones de Delphi para Windows.

Para la resolución de problemas, a los usuarios les encantaría tener una función de minería de datos para encontrar relaciones entre las versiones de hardware o sistema operativo y el error y / o bloqueo específico.

Como ejemplo de cómo debería funcionar esto:

  • Para cada bloqueo hay un informe en la base de datos, que tiene un código de huella digital / hash del seguimiento de la pila (pila de llamadas) en el momento del bloqueo para identificar duplicados
  • el algoritmo verifica si todos los duplicados de un informe de error también tienen otros atributos comunes, por ejemplo, un paquete de servicio faltante del sistema operativo
  • el resultado del análisis enumera todas las propiedades que tienen en común los informes de errores

Supongamos que estos informes automáticos de errores contienen toda la información clave, como los nombres de todos los procesos que se están ejecutando actualmente, los nombres de archivo, la información de versión de las DLL cargadas, etc.

¿Cómo puedo encontrar correlaciones entre accidentes repetidos y el medio ambiente? ¿Existen algoritmos específicos o métodos estadísticos que podrían ayudar?


fuente
2
El hallazgo de correlación es una tarea considerable. ¿Has visto esta herramienta en el trabajo? Puede ayudarlo a encontrar la manera correcta de organizar sus datos.
Entonces, ¿también quieres hacer el cálculo de correlación en Delphi? Luego, eche un vistazo a esta lista de funciones matemáticas de Delphi : cubre mucho y también ofrece explicaciones y enlaces a las bibliotecas.
@DaveBall Gracias por el interesante enlace, sin embargo, aunque los informes de errores provienen de Delphi, el servicio web en realidad está implementado en Java, tal vez pueda usar los algoritmos como punto de partida o en una herramienta de estadísticas 'fuera de línea'.
1
Es posible que desee buscar en "modelos de riesgo discreto". Este parece ser un caso en el que desea retroceder eventos de falla (bloqueos) en características fijas (variables ambientales) y el tiempo transcurrido desde el último bloqueo. Si tiene suficientes observaciones (informes de fallas), podrá agregar interacciones entre las variables ambientales al modelo. Esto lo guiará en la dirección de los conflictos del sistema. Desafortunadamente, no sé lo fácil que es implementar dicho modelo en Java.
jmtroos 05 de
1
Los tipos de análisis que podría emplear dependen del tamaño del problema, es decir, ¿cuántos tipos distintos de accidentes hay? ¿Cuántos atributos posibles hay?
Sameer

Respuestas:

1

¿Podría probar las máquinas [no bloqueadas] de su usuario para obtener la misma información que obtiene en un informe de bloqueo? Porque entonces podría usar la regresión logística para modelar esos atributos (e interacciones) a la probabilidad de sufrir un bloqueo.

zzk
fuente