金陵科技学院学报
金陵科技學院學報
금릉과기학원학보
Journal of Jinling Institute of Technology
2015年
3期
12-15
,共4页
云计算%关联规则%并行挖掘%P-FP-Growth 算法%MapReduce编程%Hadoop平台
雲計算%關聯規則%併行挖掘%P-FP-Growth 算法%MapReduce編程%Hadoop平檯
운계산%관련규칙%병행알굴%P-FP-Growth 산법%MapReduce편정%Hadoop평태
cloud computing%Association-Rule%parallel data mining%P-FP-Growth algorithm%MapReduce programming%Hadoop platform
FP-Growth 算法的效率约比 Apriori 快一个数量级,但存在 FP-tree 可能过大和串行处理等两大缺点,为此提出了基于局部 FP-tree 的并行关联规则挖掘算法 P-FP-Growth。为实现基于云计算的并行关联规则挖掘,用 MapReduce 计算模型描述了 P-FP-Growth 算法,在 Hadoop 下进行了编程实现,得出了频繁模式挖掘结果,验证了该算法在云计算平台进行部署和执行的可行性。对比了算法分别在局域网多节点并行处理和在 Hadoop平台执行的所需时间。
FP-Growth 算法的效率約比 Apriori 快一箇數量級,但存在 FP-tree 可能過大和串行處理等兩大缺點,為此提齣瞭基于跼部 FP-tree 的併行關聯規則挖掘算法 P-FP-Growth。為實現基于雲計算的併行關聯規則挖掘,用 MapReduce 計算模型描述瞭 P-FP-Growth 算法,在 Hadoop 下進行瞭編程實現,得齣瞭頻繁模式挖掘結果,驗證瞭該算法在雲計算平檯進行部署和執行的可行性。對比瞭算法分彆在跼域網多節點併行處理和在 Hadoop平檯執行的所需時間。
FP-Growth 산법적효솔약비 Apriori 쾌일개수량급,단존재 FP-tree 가능과대화천행처리등량대결점,위차제출료기우국부 FP-tree 적병행관련규칙알굴산법 P-FP-Growth。위실현기우운계산적병행관련규칙알굴,용 MapReduce 계산모형묘술료 P-FP-Growth 산법,재 Hadoop 하진행료편정실현,득출료빈번모식알굴결과,험증료해산법재운계산평태진행부서화집행적가행성。대비료산법분별재국역망다절점병행처리화재 Hadoop평태집행적소수시간。
To realize parallel Association-Rule mining based on cloud computing,the paper de-scribes the parallel Association-Rule mining algorithm on the basis of P-FP-Growth with Map Reduce model,which is put forward by the author and based on local FP-tree,programs under the Hadoop to implement it.The paper gets the result of frequent pattern mining,verifies the feasibility to deploy and executes the algorithm on cloud computing platform.Finally,it com-pares the executing time on local area network multi-nodes parallel processing with on Hadoop platform.