Mi deseo es describir la complejidad temporal de varios enfoques de agrupación. Por ejemplo, supongamos que tenemos puntos de datos en m espacio dimensional.
Supongamos además que la matriz de diferencia de pares de dimensiones ya está calculada y que ya hemos gastado pasos. ¿Cuál es entonces la complejidad del tiempo solo de
- agrupamiento jerárquico (HC) usando el enlace de Ward
- HC utilizando enlace completo
- HC utilizando enlace promedio
- HC utilizando enlace único
- enfoque k- medoide
- enfoque k- significa
¿Hay algún beneficio si la matriz de disimilitud no está ya calculada? Según tengo entendido, es necesario para el enfoque HC y medoideo, pero no para - ¿significa?
¡Gracias por tu ayuda!
Respuestas:
La agrupación de enlaces individuales es casi lo mismo que los árboles de expansión mínima en gráficos completos, tiempo O (n ^ 2) fácil. Para el tiempo O (n ^ 2) para otros métodos de agrupamiento aglomerativo (incluido estoy bastante seguro del enlace promedio y completo) vea mi artículo "Agrupamiento jerárquico rápido y otras aplicaciones de pares dinámicos más cercanos", SODA '98 y JEA '00.
fuente
Tienes que tener cuidado con algunos de los métodos. Específicamente, k-means y k-medoids son esquemas iterativos que ejecuta "hasta que haya terminado". Por lo tanto, no tiene sentido hablar sobre el tiempo de ejecución general de estos esquemas, pero es significativo hablar sobre el tiempo de ejecución de una sola iteración. Para significa, es fácil: cada iteración toma tiempo para identificar los centros más cercanos y hacer el nuevo cálculo del centro. Para medoides, el cálculo del nuevo centro puede llevar más tiempo: eso depende del procedimiento que utilice, y si es pequeño, el cálculo de los nuevos centros puede dominar los asintóticos.O ( k n ) k kk O(kn) k k
Actualización : como JeffE señala a continuación en los comentarios, hay ciertas variantes de los medios que sí han garantizado la convergencia en el tiempo polinómico, al tiempo que ofrecen respuestas de calidad. Sin embargo , no hay nada que sepa de medoids.kk k
fuente