西安交通大学学报
西安交通大學學報
서안교통대학학보
JOURNAL OF XI'AN JIAOTONG UNIVERSITY
2014年
11期
97-102
,共6页
袁通%刘志镜%刘慧%王梓
袁通%劉誌鏡%劉慧%王梓
원통%류지경%류혜%왕재
数据划分%哈希处理%多核处理器%MapReduce模型
數據劃分%哈希處理%多覈處理器%MapReduce模型
수거화분%합희처리%다핵처리기%MapReduce모형
data partitioning%hashing%multicore processors%MapReduce framework
针对传统的并行哈希划分算法不能高效地利用多核处理器的并行资源,且不能较好处理有倾斜的输入数据的问题,提出了一种在多核处理器中基于MapReduce的哈希划分算法,并且提出了存储结构优化、多步划分优化、数据倾斜优化3种优化策略.该算法将输入数据分成若干块后提交给各个线程并行处理,并选择合适的策略避免写冲突,使其能够高效地利用多核处理器的并行资源.文中提出的哈希表能够提高cache效率,从而提升算法的整体性能.引入MapReduce模型可使多步哈希划分在Map过程和Reduce过程中分别进行;数据倾斜优化策略能使算法适应有倾斜的输入数据,且具有较好的效果.实验结果表明:在多核处理器中,文中提出的算法能够适应各种分布的输入数据,并且使哈希戈分的整体性能得到提升.
針對傳統的併行哈希劃分算法不能高效地利用多覈處理器的併行資源,且不能較好處理有傾斜的輸入數據的問題,提齣瞭一種在多覈處理器中基于MapReduce的哈希劃分算法,併且提齣瞭存儲結構優化、多步劃分優化、數據傾斜優化3種優化策略.該算法將輸入數據分成若榦塊後提交給各箇線程併行處理,併選擇閤適的策略避免寫遲突,使其能夠高效地利用多覈處理器的併行資源.文中提齣的哈希錶能夠提高cache效率,從而提升算法的整體性能.引入MapReduce模型可使多步哈希劃分在Map過程和Reduce過程中分彆進行;數據傾斜優化策略能使算法適應有傾斜的輸入數據,且具有較好的效果.實驗結果錶明:在多覈處理器中,文中提齣的算法能夠適應各種分佈的輸入數據,併且使哈希戈分的整體性能得到提升.
침대전통적병행합희화분산법불능고효지이용다핵처리기적병행자원,차불능교호처리유경사적수입수거적문제,제출료일충재다핵처리기중기우MapReduce적합희화분산법,병차제출료존저결구우화、다보화분우화、수거경사우화3충우화책략.해산법장수입수거분성약간괴후제교급각개선정병행처리,병선택합괄적책략피면사충돌,사기능구고효지이용다핵처리기적병행자원.문중제출적합희표능구제고cache효솔,종이제승산법적정체성능.인입MapReduce모형가사다보합희화분재Map과정화Reduce과정중분별진행;수거경사우화책략능사산법괄응유경사적수입수거,차구유교호적효과.실험결과표명:재다핵처리기중,문중제출적산법능구괄응각충분포적수입수거,병차사합희과분적정체성능득도제승.