华南理工大学学报(自然科学版)
華南理工大學學報(自然科學版)
화남리공대학학보(자연과학판)
JOURNAL OF SOUTH CHINA UNIVERSITY OF TECHNOLOGY(NATURAL SCIENCE EDITION)
2014年
1期
135-141
,共7页
陈兴蜀%张帅%童浩%崔晓靖
陳興蜀%張帥%童浩%崔曉靖
진흥촉%장수%동호%최효정
数据挖掘%关联规则%布尔矩阵%MapReduce%FP-Growth算法
數據挖掘%關聯規則%佈爾矩陣%MapReduce%FP-Growth算法
수거알굴%관련규칙%포이구진%MapReduce%FP-Growth산법
data mining%association rules%Boolean matrix%MapReduce%FP-Growth algorithm
关联规则挖掘是数据挖掘的一个重要组成部分。为提高关联规则的挖掘效率,提出了一种基于布尔矩阵和MapReduce的FP-Growth算法(BPFP),分析了算法的时间和空间复杂度。该算法使用Hadoop框架和布尔矩阵以减少对事务数据的扫描次数,利用两次MapReduce来实现频繁项集的挖掘。在多个数据集上的实验结果表明,与原FP-Growth算法相比,BPFP算法具有更高的执行效率、更好的加速比。
關聯規則挖掘是數據挖掘的一箇重要組成部分。為提高關聯規則的挖掘效率,提齣瞭一種基于佈爾矩陣和MapReduce的FP-Growth算法(BPFP),分析瞭算法的時間和空間複雜度。該算法使用Hadoop框架和佈爾矩陣以減少對事務數據的掃描次數,利用兩次MapReduce來實現頻繁項集的挖掘。在多箇數據集上的實驗結果錶明,與原FP-Growth算法相比,BPFP算法具有更高的執行效率、更好的加速比。
관련규칙알굴시수거알굴적일개중요조성부분。위제고관련규칙적알굴효솔,제출료일충기우포이구진화MapReduce적FP-Growth산법(BPFP),분석료산법적시간화공간복잡도。해산법사용Hadoop광가화포이구진이감소대사무수거적소묘차수,이용량차MapReduce래실현빈번항집적알굴。재다개수거집상적실험결과표명,여원FP-Growth산법상비,BPFP산법구유경고적집행효솔、경호적가속비。
Association rules mining is an important part of data mining.In order to improve the efficiency of associ-ation rules mining,an FP-Growth algorithm based on Boolean matrix and MapReduce,which is marked as BPFP, is proposed,with its time and space complexity being also analyzed.In BPFP algorithm,Hadoop framework and Boolean matrix are used to reduce the number of scans of transaction data,and twice Map-Reduce is adopted to mine frequent item sets.Experimental results on multiple data sets show that the improved FP-Growth algorithm is superior to the original one due to its high execution efficiency and speedup.