计算机工程
計算機工程
계산궤공정
COMPUTER ENGINEERING
2010年
6期
89-90,93
,共3页
数据挖掘%最大频繁项集%链表数组%解空间
數據挖掘%最大頻繁項集%鏈錶數組%解空間
수거알굴%최대빈번항집%련표수조%해공간
data mining%Maximal Frequent Itemsets(MFI)%linked list array%solution space
挖掘密集型数据集的全部频繁项集代价高昂,针对该问题,提出一种数据结构链表数组和基于链表数组的最大频繁项集快速生成算法.该方法使用链表数组为每个项目建立事务链表,并且链表的创建过程只需扫描数据库1次.使用深度优先搜索得到所有候选最大频繁项集,利用约束条件缩小搜索空间.使用标准数据集进行验证测试并与其他算法进行比较,实验结果表明,该算法具有较快的挖掘速度.
挖掘密集型數據集的全部頻繁項集代價高昂,針對該問題,提齣一種數據結構鏈錶數組和基于鏈錶數組的最大頻繁項集快速生成算法.該方法使用鏈錶數組為每箇項目建立事務鏈錶,併且鏈錶的創建過程隻需掃描數據庫1次.使用深度優先搜索得到所有候選最大頻繁項集,利用約束條件縮小搜索空間.使用標準數據集進行驗證測試併與其他算法進行比較,實驗結果錶明,該算法具有較快的挖掘速度.
알굴밀집형수거집적전부빈번항집대개고앙,침대해문제,제출일충수거결구련표수조화기우련표수조적최대빈번항집쾌속생성산법.해방법사용련표수조위매개항목건립사무련표,병차련표적창건과정지수소묘수거고1차.사용심도우선수색득도소유후선최대빈번항집,이용약속조건축소수색공간.사용표준수거집진행험증측시병여기타산법진행비교,실험결과표명,해산법구유교쾌적알굴속도.
Mining all frequent itemsets in dense datasets is very expensive.Aiming at this problem,linked list array,a new data structure,and a fast method of Mining Frequent Itemsets(MFI) based on it are proposed.This method creates linked list array for each item,only needs scan database one time,uses depth-first search strategy to generate all MFI.The algorithm reduces search space by using constraint condition.It demonstrates the algorithm with standard dataset,and the experimental results confirm that the mining algorithm can significantly improve the speed of mining MFI compared with other algorithms.