南昌大学学报(理科版)
南昌大學學報(理科版)
남창대학학보(이과판)
JOURNAL OF NANCHANG UNIVERSITY(NATURAL SCIENCE)
2015年
1期
25-30,38
,共7页
关联规则挖掘%Apriori 算法%FP-growth 算法%DB-growth 算法%增量挖掘%深度挖掘
關聯規則挖掘%Apriori 算法%FP-growth 算法%DB-growth 算法%增量挖掘%深度挖掘
관련규칙알굴%Apriori 산법%FP-growth 산법%DB-growth 산법%증량알굴%심도알굴
Association rule mining%Apriori algorithm%FP-growth algorithm%DB-growth algorithm%Incre-ment mining%Depth mining
从大数据中挖掘隐藏的、多维的有价值的关联规则具有广泛的应用价值。关联规则挖掘经典算法 Apriori存在重复扫描数据库并产生大量候选项集的瓶颈问题,FP-growth 算法虽不产生候选集,但 FP-tree 不支持大数据的存储与遍历,不能有效支持大数据挖掘;另外,Apriori 以及 FP-growth 算法实施增量挖掘都需要重构关联规则,不适用于增长型事务数据挖掘。针对这些问题,设计基于关系数据库表 SourceIndex 的 DB-growth 算法,采用模式组合生成模式串的方式,更新数据库构建频繁集,有效地提高了关联规则的挖掘效率,同时对增量挖掘及深度挖掘也能得到较好的支持。
從大數據中挖掘隱藏的、多維的有價值的關聯規則具有廣汎的應用價值。關聯規則挖掘經典算法 Apriori存在重複掃描數據庫併產生大量候選項集的瓶頸問題,FP-growth 算法雖不產生候選集,但 FP-tree 不支持大數據的存儲與遍歷,不能有效支持大數據挖掘;另外,Apriori 以及 FP-growth 算法實施增量挖掘都需要重構關聯規則,不適用于增長型事務數據挖掘。針對這些問題,設計基于關繫數據庫錶 SourceIndex 的 DB-growth 算法,採用模式組閤生成模式串的方式,更新數據庫構建頻繁集,有效地提高瞭關聯規則的挖掘效率,同時對增量挖掘及深度挖掘也能得到較好的支持。
종대수거중알굴은장적、다유적유개치적관련규칙구유엄범적응용개치。관련규칙알굴경전산법 Apriori존재중복소묘수거고병산생대량후선항집적병경문제,FP-growth 산법수불산생후선집,단 FP-tree 불지지대수거적존저여편력,불능유효지지대수거알굴;령외,Apriori 이급 FP-growth 산법실시증량알굴도수요중구관련규칙,불괄용우증장형사무수거알굴。침대저사문제,설계기우관계수거고표 SourceIndex 적 DB-growth 산법,채용모식조합생성모식천적방식,경신수거고구건빈번집,유효지제고료관련규칙적알굴효솔,동시대증량알굴급심도알굴야능득도교호적지지。
Excavating potential,multidimensional valuable association rules from big data has wide applica-tion.The main association rule mining algorithm Apriori has the bottlenecks of scaning repeately database and generating big number of candidate sets,Though the FP algorithm does not generate candidate sets,but FP-tree can’t handle the problem of storage and traversal of big data;In addition,Apriori and FP-growth algorithm needs to reconstruct association rules while implementing increment mining,its not available for growth-oritened data mining.Facing those problems,designing DB-growth algorithm based on relational database table SourceIndex,applying string combinate to generate pattern,insert or update database to con-struct frequent sets,mining association rules by querying database,in addition,it supports increment min-ing and depth mining.