1 : A , B , C , E 2 : A , C , D , E 3 : B , C , E 4 : A , C , D , E 5 : C , D , E 6 : A , D , E
Quiero descubrir los conjuntos de elementos frecuentes máximos y los conjuntos de elementos frecuentes cerrados .
- El conjunto de elementos frecuentes es máximo si no tiene superconjuntos frecuentes.
- El conjunto de elementos frecuentes X ∈ F está cerrado si no tiene un superconjunto con la misma frecuencia
Así que conté la aparición de cada conjunto de elementos.
{A} = 4 ; {B} = 2 ; {C} = 5 ; {D} = 4 ; {E} = 6
{A,B} = 1; {A,C} = 3; {A,D} = 3; {A,E} = 4; {B,C} = 2;
{B,D} = 0; {B,E} = 2; {C,D} = 3; {C,E} = 5; {D,E} = 3
{A,B,C} = 1; {A,B,D} = 0; {A,B,E} = 1; {A,C,D} = 2; {A,C,E} = 3;
{A,D,E} = 3; {B,C,D} = 0; {B,C,E} = 2; {C,D,E} = 3
{A,B,C,D} = 0; {A,B,C,E} = 1; {B,C,D,E} = 0
Min_Support establecido en // Muy importante. Gracias steffen por recordar eso.
¿ Maximal = ?
¿ Cerrado = ?
data-mining
dataset
association-rules
Mike John
fuente
fuente

Es posible que desee leer sobre el algoritmo APRIORI. Evita conjuntos de elementos innecesarios mediante una poda inteligente.
B no es frecuente, eliminar.
Construye y cuenta conjuntos de dos elementos (aún no hay magia, excepto que
Bya está fuera)Todos estos son frecuentes (¡
Btenga en cuenta que todo lo que tenía no puede ser frecuente!)Ahora usa la regla de prefijo. SOLO combine conjuntos de elementos que comiencen con los mismos elementos n-1. Eliminar todo, donde cualquier subconjunto no es frecuente. Cuente los conjuntos de elementos restantes.
Tenga en cuenta que
{A,C,D}no es frecuente. Como no hay un prefijo compartido, ¡no puede haber un conjunto de elementos frecuente más grande!¡Observe cuánto menos trabajo hice!
Para conjuntos de elementos máximos / cerrados, verifique subconjuntos / supersets.
Tenga en cuenta que
{E}=6, por ejemplo , y{A,E}=4.{E}es un subconjunto, pero tiene mayor soporte, es decir, está cerrado pero no es máximo.{A}tampoco lo es, ya que no tiene mayor soporte que{A,E}, es decir, es redundante .fuente