计算机工程与设计
計算機工程與設計
계산궤공정여설계
COMPUTER ENGINEERING AND DESIGN
2013年
11期
3916-3923
,共8页
CPU/GPU异构系统%可分负载%调度算法%协同计算%负载均衡%多级缓存
CPU/GPU異構繫統%可分負載%調度算法%協同計算%負載均衡%多級緩存
CPU/GPU이구계통%가분부재%조도산법%협동계산%부재균형%다급완존
CPU/GPU heterogeneous systems%divisible loads%scheduling algorithm%coordinated computation%loads balance%multi-level caches
针对具有多个片上多核处理器CMP和多个GPU的畀构系统,综合考虑多核CPU和GPU的不同计算能力、各级缓存不同容量、CPU和GPU之间通信代价以及GPU内部结构等因素,采取计算与通信重叠、对任务自动划分、GPU端线程块大小和维度自动设置、多个异步流同时传输的方法,通过切换线程块执行以隐藏访存开销,提出一种均衡CPU和GPU负载、高效的可分负载多轮调度算法.采用计算密集型任务Mandelbrot进行实验测试,测试结果表明,与已有算法相比,该算法的调度性能有明显提升.
針對具有多箇片上多覈處理器CMP和多箇GPU的畀構繫統,綜閤攷慮多覈CPU和GPU的不同計算能力、各級緩存不同容量、CPU和GPU之間通信代價以及GPU內部結構等因素,採取計算與通信重疊、對任務自動劃分、GPU耑線程塊大小和維度自動設置、多箇異步流同時傳輸的方法,通過切換線程塊執行以隱藏訪存開銷,提齣一種均衡CPU和GPU負載、高效的可分負載多輪調度算法.採用計算密集型任務Mandelbrot進行實驗測試,測試結果錶明,與已有算法相比,該算法的調度性能有明顯提升.
침대구유다개편상다핵처리기CMP화다개GPU적비구계통,종합고필다핵CPU화GPU적불동계산능력、각급완존불동용량、CPU화GPU지간통신대개이급GPU내부결구등인소,채취계산여통신중첩、대임무자동화분、GPU단선정괴대소화유도자동설치、다개이보류동시전수적방법,통과절환선정괴집행이은장방존개소,제출일충균형CPU화GPU부재、고효적가분부재다륜조도산법.채용계산밀집형임무Mandelbrot진행실험측시,측시결과표명,여이유산법상비,해산법적조도성능유명현제승.