1 : A , B , C , E 2 : A , C , D , E 3 : B , C , E 4 : A , C , D , E 5 : C , D , E 6 : A , D , E
Quiero descubrir los conjuntos de elementos frecuentes máximos y los conjuntos de elementos frecuentes cerrados .
- El conjunto de elementos frecuentes es máximo si no tiene superconjuntos frecuentes.
- El conjunto de elementos frecuentes X ∈ F está cerrado si no tiene un superconjunto con la misma frecuencia
Así que conté la aparición de cada conjunto de elementos.
{A} = 4 ; {B} = 2 ; {C} = 5 ; {D} = 4 ; {E} = 6
{A,B} = 1; {A,C} = 3; {A,D} = 3; {A,E} = 4; {B,C} = 2;
{B,D} = 0; {B,E} = 2; {C,D} = 3; {C,E} = 5; {D,E} = 3
{A,B,C} = 1; {A,B,D} = 0; {A,B,E} = 1; {A,C,D} = 2; {A,C,E} = 3;
{A,D,E} = 3; {B,C,D} = 0; {B,C,E} = 2; {C,D,E} = 3
{A,B,C,D} = 0; {A,B,C,E} = 1; {B,C,D,E} = 0
Min_Support establecido en // Muy importante. Gracias steffen por recordar eso.
¿ Maximal = ?
¿ Cerrado = ?
data-mining
dataset
association-rules
Mike John
fuente
fuente
Es posible que desee leer sobre el algoritmo APRIORI. Evita conjuntos de elementos innecesarios mediante una poda inteligente.
B no es frecuente, eliminar.
Construye y cuenta conjuntos de dos elementos (aún no hay magia, excepto que
B
ya está fuera)Todos estos son frecuentes (¡
B
tenga en cuenta que todo lo que tenía no puede ser frecuente!)Ahora usa la regla de prefijo. SOLO combine conjuntos de elementos que comiencen con los mismos elementos n-1. Eliminar todo, donde cualquier subconjunto no es frecuente. Cuente los conjuntos de elementos restantes.
Tenga en cuenta que
{A,C,D}
no es frecuente. Como no hay un prefijo compartido, ¡no puede haber un conjunto de elementos frecuente más grande!¡Observe cuánto menos trabajo hice!
Para conjuntos de elementos máximos / cerrados, verifique subconjuntos / supersets.
Tenga en cuenta que
{E}=6
, por ejemplo , y{A,E}=4
.{E}
es un subconjunto, pero tiene mayor soporte, es decir, está cerrado pero no es máximo.{A}
tampoco lo es, ya que no tiene mayor soporte que{A,E}
, es decir, es redundante .fuente