计算机工程
計算機工程
계산궤공정
COMPUTER ENGINEERING
2014年
6期
120-124
,共5页
数据挖掘%频繁项集%精简表示%频繁核心项集%Rymon枚举树
數據挖掘%頻繁項集%精簡錶示%頻繁覈心項集%Rymon枚舉樹
수거알굴%빈번항집%정간표시%빈번핵심항집%Rymon매거수
data mining%frequent itemsets%concise representation%frequent essential itemsets%Rymon enumeration tree
传统的频繁核心项集挖掘需多次生成和反复扫描数据库,导致生成效率低下.为此,提出一种快速生成频繁核心项集算法FMEP.该算法使用Rymon枚举树作为搜索空间,并采用分而治之的策略选择特定的路径进行剪枝.利用频繁核心项集特有的反单调性质,可以快速地判断某一个候选项集是否为频繁核心项集,而无需和所有直接子集的析取支持度进行比较.通过上述方法,可以达到快速挖掘的目的.实验结果证明,该算法能够在挖掘出所有的频繁核心项集精简表示元素的同时,降低消耗时间,与MEP算法相比,在密集型数据集上的时间可缩短2倍以上,在稀疏型数据集上时间至少缩短30%.
傳統的頻繁覈心項集挖掘需多次生成和反複掃描數據庫,導緻生成效率低下.為此,提齣一種快速生成頻繁覈心項集算法FMEP.該算法使用Rymon枚舉樹作為搜索空間,併採用分而治之的策略選擇特定的路徑進行剪枝.利用頻繁覈心項集特有的反單調性質,可以快速地判斷某一箇候選項集是否為頻繁覈心項集,而無需和所有直接子集的析取支持度進行比較.通過上述方法,可以達到快速挖掘的目的.實驗結果證明,該算法能夠在挖掘齣所有的頻繁覈心項集精簡錶示元素的同時,降低消耗時間,與MEP算法相比,在密集型數據集上的時間可縮短2倍以上,在稀疏型數據集上時間至少縮短30%.
전통적빈번핵심항집알굴수다차생성화반복소묘수거고,도치생성효솔저하.위차,제출일충쾌속생성빈번핵심항집산법FMEP.해산법사용Rymon매거수작위수색공간,병채용분이치지적책략선택특정적로경진행전지.이용빈번핵심항집특유적반단조성질,가이쾌속지판단모일개후선항집시부위빈번핵심항집,이무수화소유직접자집적석취지지도진행비교.통과상술방법,가이체도쾌속알굴적목적.실험결과증명,해산법능구재알굴출소유적빈번핵심항집정간표시원소적동시,강저소모시간,여MEP산법상비,재밀집형수거집상적시간가축단2배이상,재희소형수거집상시간지소축단30%.