Estoy tratando de evaluar el rendimiento de la agrupación. Estaba leyendo la documentación de skiscit-learn sobre métricas . No entiendo la diferencia entre ARI y AMI. Me parece que hacen lo mismo de dos maneras diferentes.
Citando de la documentación:
Dado el conocimiento de las asignaciones de clase de verdad fundamental, etiquetas_verdaderas y nuestras asignaciones de algoritmos de agrupamiento de las mismas muestras etiquetas_pred, el índice Rand ajustado es una función que mide la similitud de las dos asignaciones, ignorando las permutaciones y con la normalización por azar.
vs
Dado el conocimiento de las asignaciones de clase de verdad fundamental, etiquetas_verdaderas y nuestras asignaciones de algoritmos de agrupamiento de las mismas muestras etiquetas_pred, la información mutua es una función que mide el acuerdo de las dos asignaciones, ignorando las permutaciones ... AMI se propuso más recientemente y se normaliza contra oportunidad.
¿Debo usar ambos en mi evaluación de agrupamiento o sería redundante?
fuente
Respuestas:
Son dos de una docena que intentan comparar agrupaciones.
Pero no son equivalentes. Usan teorías diferentes.
A veces, ARI puede preferir un resultado y el IAM otro. Pero a menudo están de acuerdo en preferencia (no en los números).
fuente
La regla de oro es:
Trabajé en este tema. Referencia: Ajuste de las medidas de comparación de agrupamiento aleatorio
fuente