¿Alguien ha usado (y le ha gustado) algún buen paquete de "minería de secuencia frecuente" en Python que no sea el FPM en MLLib? Estoy buscando un paquete estable, preferiblemente calmado mantenido por personas. ¡Gracias!
python
sequential-pattern-mining
edamame
fuente
fuente
Mantengo activamente una implementación eficiente tanto de PrefixSpan como de BIDE en Python 3, soportando la minería de patrones secuenciales frecuentes y top-k (cerrados).
https://github.com/chuanconggao/PrefixSpan-py
fuente
He usado la función fpgrowth de fim en el pasado y funcionó bien. Sin embargo, es un poco difícil instalarlo en máquinas con Windows. Parece ser un sitio web académico, así que no estoy seguro de si están haciendo muchas actualizaciones al código con el tiempo ...
fuente
¿Has considerado escribirlo tú mismo? Porque probablemente no hay una biblioteca actualizada actualizada en este momento.
Mira esto, es lo básico: los patrones PrefixSpan y Closed / Maximal en realidad no son tan difíciles de implementar:
http://sequenceanalysis.github.io/
fuente
SPMF suena como una biblioteca útil para la minería de patrones: http://www.philippe-fournier-viger.com/spmf/
fuente