计算机科学
計算機科學
계산궤과학
COMPUTER SCIENCE
2013年
12期
223-228
,共6页
频繁项目集%最大频繁项目集%FP-tree%FPMAX%FP-growth
頻繁項目集%最大頻繁項目集%FP-tree%FPMAX%FP-growth
빈번항목집%최대빈번항목집%FP-tree%FPMAX%FP-growth
Frequent itemset%Maximal frequent itemset%FP-tree%FPMAX%FP-growth
挖掘事务数据库中的最大频繁项目集是数据挖掘领域一个重要的研究方向.基于FP-tree的FPMAX算法是目前较为高效与稳定的最大频繁项目集挖掘算法之一.然而对于稠密数据库中的挖掘,FPMAX会产生大量的冗余递归过程,导致额外的条件FP-tree构造开销.而且在支持度较低时,FPMAX则会因用于超集检测的全局MFI-tree较为庞大而导致超集检测的性能下降.为此提出FPMAX的改进算法FPMAX-reduce,其通过采用基于事务共同后缀的前瞻剪枝策略来减少挖掘过程中的冗余递归过程.当递归过程中产生的新条件FP-tree规模较小时,FPMMX-reduce通过构造条件MFI-tree来减小后续超集检测遍历的开销.性能试验表明,FPMAX-reduce算法通过有效的前瞻剪枝,在稠密事务数据库以及低支持度的情况下至多可将递归过程减少至原算法的一半以下,进而有效地提高了FPMAX算法的效率.
挖掘事務數據庫中的最大頻繁項目集是數據挖掘領域一箇重要的研究方嚮.基于FP-tree的FPMAX算法是目前較為高效與穩定的最大頻繁項目集挖掘算法之一.然而對于稠密數據庫中的挖掘,FPMAX會產生大量的冗餘遞歸過程,導緻額外的條件FP-tree構造開銷.而且在支持度較低時,FPMAX則會因用于超集檢測的全跼MFI-tree較為龐大而導緻超集檢測的性能下降.為此提齣FPMAX的改進算法FPMAX-reduce,其通過採用基于事務共同後綴的前瞻剪枝策略來減少挖掘過程中的冗餘遞歸過程.噹遞歸過程中產生的新條件FP-tree規模較小時,FPMMX-reduce通過構造條件MFI-tree來減小後續超集檢測遍歷的開銷.性能試驗錶明,FPMAX-reduce算法通過有效的前瞻剪枝,在稠密事務數據庫以及低支持度的情況下至多可將遞歸過程減少至原算法的一半以下,進而有效地提高瞭FPMAX算法的效率.
알굴사무수거고중적최대빈번항목집시수거알굴영역일개중요적연구방향.기우FP-tree적FPMAX산법시목전교위고효여은정적최대빈번항목집알굴산법지일.연이대우주밀수거고중적알굴,FPMAX회산생대량적용여체귀과정,도치액외적조건FP-tree구조개소.이차재지지도교저시,FPMAX칙회인용우초집검측적전국MFI-tree교위방대이도치초집검측적성능하강.위차제출FPMAX적개진산법FPMAX-reduce,기통과채용기우사무공동후철적전첨전지책략래감소알굴과정중적용여체귀과정.당체귀과정중산생적신조건FP-tree규모교소시,FPMMX-reduce통과구조조건MFI-tree래감소후속초집검측편력적개소.성능시험표명,FPMAX-reduce산법통과유효적전첨전지,재주밀사무수거고이급저지지도적정황하지다가장체귀과정감소지원산법적일반이하,진이유효지제고료FPMAX산법적효솔.