Tengo dos particiones de y estoy buscando la distancia de edición entre ellas.
Con esto, quiero encontrar el número mínimo de transiciones individuales de un nodo en un grupo diferente que son necesarias para pasar de la partición A a la partición B.
Por ejemplo, la distancia desde {0 1} {2 3} {4}
adentro {0} {1} {2 3 4}
sería dos
Después de buscar me encontré con este documento, pero a) no estoy seguro de si están teniendo en cuenta el orden de los grupos (algo que no me importa) a su distancia b) No estoy seguro de cómo funciona yc) No hay referencias
Cualquier ayuda apreciada
Respuestas:
Este problema se puede transformar en el problema de asignación , también conocido como problema de coincidencia bipartita ponderada máxima.
Tenga en cuenta primero que la distancia de edición es igual al número de elementos que deben cambiar de un conjunto a otro. Esto es igual al número total de elementos menos el número de elementos que no necesitan cambiar. Por lo tanto, encontrar el número mínimo de elementos que no cambian es equivalente a encontrar el número máximo de vértices que no cambian.
Deje que y B = { B 1 , B 2 , . . . , B l } sea particiones de [ 1 , 2 , . . . , n ] . Además, sin pérdida de generalidad, sea k ≥ l (permitido porque e d i tA={A1,A2,...,Ak} B={B1,B2,...,Bl} [1,2,...,n] k≥l ). Entonces dejemos que B l + 1 , B l + 2 , ..., B k sean el conjunto vacío. Entonces el número máximo de vértices que no cambian es:edit(A,B)=edit(B,A) Bl+1 Bl+2 Bk
donde es una permutación de [ 1 , 2 , . . . , k ] .f [1,2,...,k]
Este es exactamente el problema de asignación donde los vértices son , ..., A k , B 1 , ..., B k y los bordes son pares ( A i , B j ) con peso | A i ∩ B j | . Esto se puede resolver en el tiempo O ( | V | 2 log | V | + | V | | E | ) .A1 Ak B1 Bk (Ai,Bj) |Ai∩Bj| O(|V|2log|V|+|V||E|)
fuente
Mira el PDF de este documento
http://www.ploscompbiol.org/article/info:doi/10.1371/journal.pcbi.0030160
La definición de distancia de edición allí es exactamente lo que necesita, creo. La partición de 'referencia' sería (una arbitraria) una de sus dos particiones, la otra sería simplemente la otra. También contiene citas relevantes.
Mejor, Rob
fuente
Cranky idea del domingo por la mañana que podría o no ser correcta:
Wlog, deja que sea la partición con más conjuntos, P 2 el otro. Primero, asigne diferentes nombres por pares n 1 ( S ) ∈ Σ a sus conjuntos P 1 . Luego, encuentre un mejor nombre n 2 ( S ) para los conjuntos P 2 según las siguientes reglas:P1 P2 n1(S)∈Σ P1 n2(S) P2
fuente