计算机研究与发展
計算機研究與髮展
계산궤연구여발전
JOURNAL OF COMPUTER RESEARCH AND DEVELOPMENT
2014年
6期
1281-1294
,共14页
可分负载%并行调度%多核异构机群%多级缓存划分%k-选择
可分負載%併行調度%多覈異構機群%多級緩存劃分%k-選擇
가분부재%병행조도%다핵이구궤군%다급완존화분%k-선택
divisible%loads%parallel%scheduling%heterogeneous%multi-core%cluster%multi-level%cache%partitioning%k-selection
对于节点计算、通信与存储能力不同、节点由多个多核处理器(多个片上多处理器)组成且共享L3 cache的机群系统,采取计算与传输重叠模式,提出了主节点以多进程方式并发发送数据给从节点的可分负载调度模型.该调度模型自适应节点具有不同的计算、通信和存储能力,动态计算、确定调度轮数和每轮调度分配给各从节点的负载块规模,以平衡各节点的计算负载、减少节点之间的通信开销,缩短任务调度长度.依据各节点中的L3 cache,L2 cache和L1 cache的可用存储容量,提出了对节点主存中接收到的负载块进行多级缓存划分的数据分配方法,以确保分配给节点中各个多核处理器、各个内核的负载平衡.基于提出的多核机群节点间可分负载调度模型和节点内多级存储数据分配方法,设计实现了节点拥有多个多核处理器的异构机群上通信和存储高效的k-选择并行算法.在曙光TC5000A多核机群系统上,测试了主节点并行与串行发送数据给从节点的任务调度方式、各级缓存利用率、每个核心执行不同数目的线程对并行算法运行性能的影响.实验结果表明:基于主节点并发发送数据给从节点的调度模型设计的k-选择并行算法,其运行性能优于基于主节点串行发送数据给从节点的调度模型设计的k-选择并行算法;L3 cache和L2 cache利用率大小对算法运行性能影响较大;当L3 cache,L2 cache和L1 cache利用率取其优化组合值、每个核心运行3个线程时,算法所需的运行时间最短.
對于節點計算、通信與存儲能力不同、節點由多箇多覈處理器(多箇片上多處理器)組成且共享L3 cache的機群繫統,採取計算與傳輸重疊模式,提齣瞭主節點以多進程方式併髮髮送數據給從節點的可分負載調度模型.該調度模型自適應節點具有不同的計算、通信和存儲能力,動態計算、確定調度輪數和每輪調度分配給各從節點的負載塊規模,以平衡各節點的計算負載、減少節點之間的通信開銷,縮短任務調度長度.依據各節點中的L3 cache,L2 cache和L1 cache的可用存儲容量,提齣瞭對節點主存中接收到的負載塊進行多級緩存劃分的數據分配方法,以確保分配給節點中各箇多覈處理器、各箇內覈的負載平衡.基于提齣的多覈機群節點間可分負載調度模型和節點內多級存儲數據分配方法,設計實現瞭節點擁有多箇多覈處理器的異構機群上通信和存儲高效的k-選擇併行算法.在曙光TC5000A多覈機群繫統上,測試瞭主節點併行與串行髮送數據給從節點的任務調度方式、各級緩存利用率、每箇覈心執行不同數目的線程對併行算法運行性能的影響.實驗結果錶明:基于主節點併髮髮送數據給從節點的調度模型設計的k-選擇併行算法,其運行性能優于基于主節點串行髮送數據給從節點的調度模型設計的k-選擇併行算法;L3 cache和L2 cache利用率大小對算法運行性能影響較大;噹L3 cache,L2 cache和L1 cache利用率取其優化組閤值、每箇覈心運行3箇線程時,算法所需的運行時間最短.
대우절점계산、통신여존저능력불동、절점유다개다핵처리기(다개편상다처리기)조성차공향L3 cache적궤군계통,채취계산여전수중첩모식,제출료주절점이다진정방식병발발송수거급종절점적가분부재조도모형.해조도모형자괄응절점구유불동적계산、통신화존저능력,동태계산、학정조도륜수화매륜조도분배급각종절점적부재괴규모,이평형각절점적계산부재、감소절점지간적통신개소,축단임무조도장도.의거각절점중적L3 cache,L2 cache화L1 cache적가용존저용량,제출료대절점주존중접수도적부재괴진행다급완존화분적수거분배방법,이학보분배급절점중각개다핵처리기、각개내핵적부재평형.기우제출적다핵궤군절점간가분부재조도모형화절점내다급존저수거분배방법,설계실현료절점옹유다개다핵처리기적이구궤군상통신화존저고효적k-선택병행산법.재서광TC5000A다핵궤군계통상,측시료주절점병행여천행발송수거급종절점적임무조도방식、각급완존이용솔、매개핵심집행불동수목적선정대병행산법운행성능적영향.실험결과표명:기우주절점병발발송수거급종절점적조도모형설계적k-선택병행산법,기운행성능우우기우주절점천행발송수거급종절점적조도모형설계적k-선택병행산법;L3 cache화L2 cache이용솔대소대산법운행성능영향교대;당L3 cache,L2 cache화L1 cache이용솔취기우화조합치、매개핵심운행3개선정시,산법소수적운행시간최단.