¿Qué algoritmo de aprendizaje automático se puede usar para identificar patrones en un conjunto de datos del rendimiento de caché de una CPU?

9

Necesito un algoritmo de aprendizaje automático para identificar patrones en un conjunto de datos (guardado en un archivo CSV) que contiene detalles del rendimiento de caché de una CPU. Más específicamente, el conjunto de datos contiene columnas como Readhits, Readmisso Writehits.

Los patrones que identifica el algoritmo deberían ser útiles de las siguientes maneras.

  1. ayudar al usuario a aumentar el rendimiento de la carga de trabajo la próxima vez,

  2. ayuda para identificar cualquier problema basado en las características, o

  3. ayudar al usuario a predecir valores de datos futuros o eventos futuros que puedan ocurrir en función de los patrones.

¿Qué algoritmos de ML puedo usar?

aAAAAAAa
fuente

Respuestas:

0

Las máquinas de Boltzmann restringidas (RBM) pueden identificar patrones en un archivo CSV sin que el usuario especifique ninguna condición. Están bien preparados para generar "representaciones distribuidas y graduadas" de un "conjunto complejo de características que componen datos reales de alta dimensión es crucial para lograr un alto rendimiento en las tareas de aprendizaje automático". 1

Debido a que el formato CSV está diseñado específicamente para representar instancias en filas y un conjunto estático de atributos en columnas, la configuración de la capacitación es sencilla. Si el objetivo es identificar patrones temporales, puede ser necesaria una estrategia de ventanas.

Los K-RBM son una fusión de enfoques k-mean con RBM. La elección del enfoque tiene mucho que ver con qué tipos de patrones se buscan. El término patrón puede aplicarse a tendencias simples en números a lo largo del tiempo, patrones comunes encontrados en columnas textuales o patrones complejos inferidos de múltiples columnas.

Referencias

[1] Aparición de representaciones compositivas en máquinas de Boltzmann restringidas , J. Tubiana, R. Monasson, 2017)

[2] Aprendizaje de múltiples subespacios no lineales utilizando K-RBM , Siddhartha Chandra, Shailesh Kumar y CV Jawahar

Douglas Daseeco
fuente
0

Yo personalmente iría con k-means clustering. Está diseñado para problemas como este.

William Scott
fuente
0

Necesito un algoritmo de aprendizaje automático para identificar cualquier patrón en un archivo CSV

Desea hacer un aprendizaje sin supervisión . La definición de Wikipedia de lo mismo es:

El aprendizaje automático no supervisado es la tarea de aprendizaje automático de inferir una función para describir la estructura oculta a partir de datos "sin etiquetar" (una clasificación o categorización no se incluye en las observaciones).

Le recomendaré que revise la lista de algoritmos de aprendizaje no supervisados aquí y use el que se ajuste a sus necesidades.

Si está comenzando, entonces recomendaría comenzar con el aprendizaje del algoritmo de agrupación de K-means .

Dawny33
fuente
0

Primero, debe clasificar cada fragmento del archivo CSV y etiquetarlo en función de la situación actual, como A) situación óptima B) crítica.

Luego, agrupa sus datos con un algoritmo de aprendizaje no supervisado, como SOM o k-means, y luego simplemente clasifica las clases que obtendrá.

simonepi
fuente
0

Básicamente lo que estás buscando es un aprendizaje sin supervisión (UL). Existen muchas técnicas de UL, pero no estoy seguro de que encuentre una que haga exactamente lo que desea sin ninguna intervención del usuario. Aún así, si hojea la literatura sobre estos enfoques, puede encontrar algo útil.

Una opción es DBSCAN , un algoritmo de agrupación muy popular que no requiere que el usuario ingrese un número objetivo inicial de agrupaciones (algo que sí requieren la mayoría de los algoritmos de agrupación). Pero incluso entonces, todavía tiene que dar los valores del algoritmo para epsilon(una distancia utilizada en el cálculo de los grupos) y minPts(el número mínimo de puntos necesarios para constituir una región "densa").

También puede mirar mapas autoorganizados , un enfoque para el aprendizaje no supervisado para redes neuronales.

Algunos otros términos de búsqueda que pueden llevarlo en una dirección útil incluyen "minería de datos" y "descubrimiento de conocimiento en bases de datos" (KDD).

crimen mental
fuente