计算机应用
計算機應用
계산궤응용
COMPUTER APPLICATION
2015年
3期
775-778
,共4页
杨鹏坤%彭慧%周晓锋%孙玉庆
楊鵬坤%彭慧%週曉鋒%孫玉慶
양붕곤%팽혜%주효봉%손옥경
最大频繁项集%频繁模式树%数据挖掘%关联规则%非频繁项集
最大頻繁項集%頻繁模式樹%數據挖掘%關聯規則%非頻繁項集
최대빈번항집%빈번모식수%수거알굴%관련규칙%비빈번항집
maximum frequent itemset%Frequent Pattern tree (FP-tree)%data mining%association rule%infrequent itemset
针对最大频繁项目集挖掘算法(DMFIA)当候选项目集维数高而最大频繁项目集维数较低的情况下要产生大量的候选项目集的缺点,提出了一种改进的基于频繁模式树(FP-tree)结构的最大频繁项目集挖掘算法——FP-MFIA.该算法根据FP-tree的项目头表,采用自底向上的搜索策略逐层挖掘最大频繁项目集,从而加速每次对候选集计数的操作.在挖掘时根据每层的条件模式基产生维数较低的非频繁项目集,尽早对候选项目集进行剪枝和降维,可大量减少候选项目集的数量.同时在挖掘时充分利用最大频繁项集的性质,减少搜索空间.通过算法在不同支持度下挖掘时间的对比可知,算法FP-MFIA在最小支持度较低的情况下时间效率是DMFIA以及基于降维的最大频繁模式挖掘算法(BDRFI)的2倍以上,说明FP-MFIA在候选集维数较高的时候优势明显.
針對最大頻繁項目集挖掘算法(DMFIA)噹候選項目集維數高而最大頻繁項目集維數較低的情況下要產生大量的候選項目集的缺點,提齣瞭一種改進的基于頻繁模式樹(FP-tree)結構的最大頻繁項目集挖掘算法——FP-MFIA.該算法根據FP-tree的項目頭錶,採用自底嚮上的搜索策略逐層挖掘最大頻繁項目集,從而加速每次對候選集計數的操作.在挖掘時根據每層的條件模式基產生維數較低的非頻繁項目集,儘早對候選項目集進行剪枝和降維,可大量減少候選項目集的數量.同時在挖掘時充分利用最大頻繁項集的性質,減少搜索空間.通過算法在不同支持度下挖掘時間的對比可知,算法FP-MFIA在最小支持度較低的情況下時間效率是DMFIA以及基于降維的最大頻繁模式挖掘算法(BDRFI)的2倍以上,說明FP-MFIA在候選集維數較高的時候優勢明顯.
침대최대빈번항목집알굴산법(DMFIA)당후선항목집유수고이최대빈번항목집유수교저적정황하요산생대량적후선항목집적결점,제출료일충개진적기우빈번모식수(FP-tree)결구적최대빈번항목집알굴산법——FP-MFIA.해산법근거FP-tree적항목두표,채용자저향상적수색책략축층알굴최대빈번항목집,종이가속매차대후선집계수적조작.재알굴시근거매층적조건모식기산생유수교저적비빈번항목집,진조대후선항목집진행전지화강유,가대량감소후선항목집적수량.동시재알굴시충분이용최대빈번항집적성질,감소수색공간.통과산법재불동지지도하알굴시간적대비가지,산법FP-MFIA재최소지지도교저적정황하시간효솔시DMFIA이급기우강유적최대빈번모식알굴산법(BDRFI)적2배이상,설명FP-MFIA재후선집유수교고적시후우세명현.