Hyppig mønster minedrift, også kendt som hyppig itemset minedrift, er en teknik til at opdage grupper af elementer, der hyppigt optræder sammen i en database . Ifølge Dr. Christian Borgelt , Principal Forsker ved Det Europæiske Center for Soft Computing, har hyppig mønster minedrift været en af de mest aktivt forsket emner i data mining siden begyndelsen af 1990'erne og talrige matematiske algoritmer er blevet udviklet . Hyppig Pattern Mining
Hyppig mønster mining er en elementær problem i mange applikationer. En typisk transaktionsbeslutning database - såsom en database, der beskriver opførslen af de handlende på Main Street, ved postordre eller online - indeholder et stort antal itemsets og præsenterer en udfordring i forhold til at udvikle effektive , skalerbare algoritmer. Hyppige mønster minedrift algoritmer kendt som Apriori , Eclat og FP - vækst er blandt de mest kendte .
Apriori algoritme
Apriori algoritme , først foreslået af Rakesh Agrawal og Ramkrishnan Srikant af IBM Almaden Research Center i 1994, arbejder på det princip, at itemsets tælles , når de opstår i forbindelse med transaktioner . Databasen er scannet for at finde hyppige 1 - itemsets er de 1 - itemsets anvendes til at generere 2 - itemsets og så videre op til k- itemsets . En k- itemset siges at være hyppige hvis og kun hvis alle dets subitemsets er hyppige. Da det først blev foreslået , har talrige forbedringer til Apriori algoritme blevet foreslået
FP- vækst Algoritme
FP- vækst algoritme - . FP står for " frequent Pattern " - beskæftiger en teknik kendt som algoritmen scanner databasen til at oprette en liste over hyppige elementer i faldende rækkefølge , som den bruger til at komprimere databasen til en FP- træ " del og hersk ". . FP- træet selv brydes , begyndende med hver hyppig længde -1 mønster - også kendt som en suffix mønster - at skabe en betinget FP- træet, som indeholder præfikser svarer til elementer, som co- forekomme med den oprindelige endelse mønster. Den oprindelige endelse mønster sammenkædet med de hyppige mønstre findes i den betingede FP -tree at opnå mønster vækst.
Eclat Algoritme
Apriori og FP - vækst algoritmer minen hyppige mønstre fra et sæt af transaktioner anbragt vandret . Ækvivalens klasse Transformation ( Eclat ) algoritme - foreslået af Mohammed J. Zaki , professor i datalogi ved Rensselaer Polytechnic Institute i 2000 - på den anden side , arrangeret miner hyppige mønstre i et sæt af transaktioner lodret. Den Eclat algoritme starter med et enkelt element , og bruger et sæt kryds for at bestemme hyppige itemsets og gentager indtil yderligere hyppige itemsets kan findes.