¿Alguien puede decirme los factores que afectan los requisitos de memoria de significa clustering con un poco de explicación?
clustering
k-means
Martín
fuente
fuente
Respuestas:
Algoritmos como Lloyds pueden implementarse con valores de coma flotante que solo se usan en la memoria. El algoritmo MacQueens k-means solo debería necesitar memoria .k⋅(2⋅d+1) k⋅(d+1)
Sin embargo, como la mayoría de los usuarios querrán saber qué punto pertenece a qué clúster, casi todas las implementaciones que encontrarán usarán memoria .O(n+k⋅d)
En otras palabras, el uso de memoria por k-means es esencialmente el tamaño de los datos de salida .
fuente
Hace poco me encontré con una nota de una implementación descuidada del algoritmo k-means en scipy.cluster.vq.py
fuente