计算机应用
計算機應用
계산궤응용
COMPUTER APPLICATION
2014年
z2期
113-116
,共4页
数据挖掘%关联规则%频繁项目集%Apriori算法%分解事务矩阵
數據挖掘%關聯規則%頻繁項目集%Apriori算法%分解事務矩陣
수거알굴%관련규칙%빈번항목집%Apriori산법%분해사무구진
data mining%association rule%frequent item sets%Apriori algorithm%decomposed transaction matrix
Apriori算法是数据挖掘领域挖掘关联规则频繁项目集的经典算法,但该算法存在产生大量的候选项目集及需要多次扫描数据库的缺陷。为此提出一种新的挖掘关联规则频繁项目集算法( CApriori算法):利用分解事务矩阵来压缩存放数据库的相关信息,进而对分解事务矩阵进行关联规则挖掘;优化了由频繁k -1项目集生成频繁k项目集的连接过程;提出了一种不需要扫描数据库,利用行集“与运算”快速计算支持数的方法,改进算法挖掘所有的频繁项目集只需扫描数据库两次。实验结果表明,改进算法在最小支持度较小时效率高于Apriori算法。
Apriori算法是數據挖掘領域挖掘關聯規則頻繁項目集的經典算法,但該算法存在產生大量的候選項目集及需要多次掃描數據庫的缺陷。為此提齣一種新的挖掘關聯規則頻繁項目集算法( CApriori算法):利用分解事務矩陣來壓縮存放數據庫的相關信息,進而對分解事務矩陣進行關聯規則挖掘;優化瞭由頻繁k -1項目集生成頻繁k項目集的連接過程;提齣瞭一種不需要掃描數據庫,利用行集“與運算”快速計算支持數的方法,改進算法挖掘所有的頻繁項目集隻需掃描數據庫兩次。實驗結果錶明,改進算法在最小支持度較小時效率高于Apriori算法。
Apriori산법시수거알굴영역알굴관련규칙빈번항목집적경전산법,단해산법존재산생대량적후선항목집급수요다차소묘수거고적결함。위차제출일충신적알굴관련규칙빈번항목집산법( CApriori산법):이용분해사무구진래압축존방수거고적상관신식,진이대분해사무구진진행관련규칙알굴;우화료유빈번k -1항목집생성빈번k항목집적련접과정;제출료일충불수요소묘수거고,이용행집“여운산”쾌속계산지지수적방법,개진산법알굴소유적빈번항목집지수소묘수거고량차。실험결과표명,개진산법재최소지지도교소시효솔고우Apriori산법。
Apriori algorithm is a classical algorithm that detects frequent item sets of association rules in data mining field, but it has defects in generating a huge number of candidate item sets and scanning the database many times. Therefore, this paper proposed a new algorithm named CApriori. It used the decomposed transaction matrix to compress information of database, then mined association rules in decomposed transaction matrix. It also optimized the process of connection when generating frequent k item sets from frequent k - 1 item sets. It put forward a kind of method using the “and operation” to calculate the supports of all candidate item sets without scanning the database. The new algorithm only needs to scan database two times. The experimental results prove that the improved algorithm is more effective than Apriori algorithm when the minimum support is low.