电子科技
電子科技
전자과기
IT AGE
2012年
5期
126-128,136
,共4页
数据挖掘%事务矩阵%支持矩阵%向量内积%裁剪
數據挖掘%事務矩陣%支持矩陣%嚮量內積%裁剪
수거알굴%사무구진%지지구진%향량내적%재전
data mining%transaction matrix%support matrix%inner product%prune
Apriori及其改进算法可以归为基于SQL和基于内存两类,为提高关联规则挖掘效率,在分析了一部分第二类算法存在效率瓶颈的基础上,提出了一种高效的改进算法。算法引入两个矩阵,一个矩阵用以映射数据库,另一个用作存储频繁2-项集相关信息,通过对两个矩阵的操作,使得算法时间复杂度明显降低。验证明,算法具有较好的性能。
Apriori及其改進算法可以歸為基于SQL和基于內存兩類,為提高關聯規則挖掘效率,在分析瞭一部分第二類算法存在效率瓶頸的基礎上,提齣瞭一種高效的改進算法。算法引入兩箇矩陣,一箇矩陣用以映射數據庫,另一箇用作存儲頻繁2-項集相關信息,通過對兩箇矩陣的操作,使得算法時間複雜度明顯降低。驗證明,算法具有較好的性能。
Apriori급기개진산법가이귀위기우SQL화기우내존량류,위제고관련규칙알굴효솔,재분석료일부분제이류산법존재효솔병경적기출상,제출료일충고효적개진산법。산법인입량개구진,일개구진용이영사수거고,령일개용작존저빈번2-항집상관신식,통과대량개구진적조작,사득산법시간복잡도명현강저。험증명,산법구유교호적성능。
Apriori and its improved algorithms can be generally classified into two kinds:SQL-based and on memory-based.In order to improve association rule mining efficiency,after analyzing the efficiency bottlenecks in some algorithms of the second class,an improved efficient algorithm is proposed.Two matrixes are introduced into the algorithm:one is used to map database and the other to store frequent 2-itemsets related information.Through the operation of two matrixes,its time complexity and space complexity decrease significantly.The experiment indicates that the method has better performance.