电脑与信息技术
電腦與信息技術
전뇌여신식기술
COMPUTER AND INFORMATION TECHNOLOGY
2012年
1期
22-25
,共4页
数据挖掘%Apriori算法%候选项集%矩阵%链表
數據挖掘%Apriori算法%候選項集%矩陣%鏈錶
수거알굴%Apriori산법%후선항집%구진%련표
data mining%apriori algorithm%candidate set%matrix%linked list
为了解决Apriori算法中生成候选二项集不能剪枝、多次扫描数据库中对计算支持度不产生作用的项等缺点,提出了使用矩阵直接生成频繁二项集及候选三项集,使用链表删除对计算支持度不产生作用的数据的方法。通过设置不同的最小支持度将两个算法的运行时间进行对比,根据结果分析证明改进后的算法比Apriori算法执行效率高。
為瞭解決Apriori算法中生成候選二項集不能剪枝、多次掃描數據庫中對計算支持度不產生作用的項等缺點,提齣瞭使用矩陣直接生成頻繁二項集及候選三項集,使用鏈錶刪除對計算支持度不產生作用的數據的方法。通過設置不同的最小支持度將兩箇算法的運行時間進行對比,根據結果分析證明改進後的算法比Apriori算法執行效率高。
위료해결Apriori산법중생성후선이항집불능전지、다차소묘수거고중대계산지지도불산생작용적항등결점,제출료사용구진직접생성빈번이항집급후선삼항집,사용련표산제대계산지지도불산생작용적수거적방법。통과설치불동적최소지지도장량개산법적운행시간진행대비,근거결과분석증명개진후적산법비Apriori산법집행효솔고。
In order to solve these disadvantages,like generating candidate binomial spaces can't be pruned,and scanning the terms that have no effect on the counting support in database for many times,then,proposing methods of using Matrix to generate Frequent binomial spaces and candidate trinomial spaces directly,and using Linked List to delete the terms that have no effect on the counting support.Last but not the least,this paper validates the improved algorithm by setting different minmum support of two algorithms to compare the running time to prove that the execution efficiency of the algorithm can be increased.