计算机工程
計算機工程
계산궤공정
COMPUTER ENGINEERING
2012年
15期
43-45
,共3页
云计算%并行处理%Map Reduce模型%PrefixSpan算法%序列模式%Hadoop平台
雲計算%併行處理%Map Reduce模型%PrefixSpan算法%序列模式%Hadoop平檯
운계산%병행처리%Map Reduce모형%PrefixSpan산법%서렬모식%Hadoop평태
传统数据挖掘算法在处理海量数据集时计算能力有限.为解决该问题,提出一种基于Map Reduce的分布式序列模式挖掘算法MR-PrefixSpan.在PrefixSpan算法的基础上,对模式挖掘任务进行分割,利用Map函数处理由不同前缀得到的序列模式,并行构造投影数据库,从而提高挖掘效率及简化搜索空间.采用Reduce函数对中间结果进行规约,得到全局序列模式.在Hadoop集群上的实验结果表明,MR-PrefixSpan能减少数据库扫描时间,具有较高的并行加速比和较好的可扩展性.
傳統數據挖掘算法在處理海量數據集時計算能力有限.為解決該問題,提齣一種基于Map Reduce的分佈式序列模式挖掘算法MR-PrefixSpan.在PrefixSpan算法的基礎上,對模式挖掘任務進行分割,利用Map函數處理由不同前綴得到的序列模式,併行構造投影數據庫,從而提高挖掘效率及簡化搜索空間.採用Reduce函數對中間結果進行規約,得到全跼序列模式.在Hadoop集群上的實驗結果錶明,MR-PrefixSpan能減少數據庫掃描時間,具有較高的併行加速比和較好的可擴展性.
전통수거알굴산법재처리해량수거집시계산능력유한.위해결해문제,제출일충기우Map Reduce적분포식서렬모식알굴산법MR-PrefixSpan.재PrefixSpan산법적기출상,대모식알굴임무진행분할,이용Map함수처이유불동전철득도적서렬모식,병행구조투영수거고,종이제고알굴효솔급간화수색공간.채용Reduce함수대중간결과진행규약,득도전국서렬모식.재Hadoop집군상적실험결과표명,MR-PrefixSpan능감소수거고소묘시간,구유교고적병행가속비화교호적가확전성.