电子学报
電子學報
전자학보
ACTA ELECTRONICA SINICA
2012年
2期
223-229
,共7页
刘勇鹏%王锋%卢凯%刘勇燕
劉勇鵬%王鋒%盧凱%劉勇燕
류용붕%왕봉%로개%류용연
异构并行体系结构%检查点%数据压缩%软流水线%图形处理器
異構併行體繫結構%檢查點%數據壓縮%軟流水線%圖形處理器
이구병행체계결구%검사점%수거압축%연류수선%도형처리기
在大规模并行计算系统中,并行检查点触发大量结点同时保存计算状态,造成巨大文件存储空间开销,以及对通信和存储系统的巨大访问压力.数据压缩可以缩小检查点文件尺寸,从而降低存储空间开销以及对通信和存储系统的访问压力.但是,它也带来额外的压缩计算开销.本文针对异构并行计算系统,提出流水线式并行压缩检查点技术,采用一系列优化技术来降低压缩引入的计算延时,包括:流水线式双重写缓存队列、文件写操作的合并、GPU加速的流水压缩算法和GPU资源的多进程调度,等等.本文介绍了该技术在天河一号系统中的实现,并对所实现的检查点系统进行综合评测.实验数据表明该方法在大规模异构并行计算系统中是可行、高效、实用的.
在大規模併行計算繫統中,併行檢查點觸髮大量結點同時保存計算狀態,造成巨大文件存儲空間開銷,以及對通信和存儲繫統的巨大訪問壓力.數據壓縮可以縮小檢查點文件呎吋,從而降低存儲空間開銷以及對通信和存儲繫統的訪問壓力.但是,它也帶來額外的壓縮計算開銷.本文針對異構併行計算繫統,提齣流水線式併行壓縮檢查點技術,採用一繫列優化技術來降低壓縮引入的計算延時,包括:流水線式雙重寫緩存隊列、文件寫操作的閤併、GPU加速的流水壓縮算法和GPU資源的多進程調度,等等.本文介紹瞭該技術在天河一號繫統中的實現,併對所實現的檢查點繫統進行綜閤評測.實驗數據錶明該方法在大規模異構併行計算繫統中是可行、高效、實用的.
재대규모병행계산계통중,병행검사점촉발대량결점동시보존계산상태,조성거대문건존저공간개소,이급대통신화존저계통적거대방문압력.수거압축가이축소검사점문건척촌,종이강저존저공간개소이급대통신화존저계통적방문압력.단시,타야대래액외적압축계산개소.본문침대이구병행계산계통,제출류수선식병행압축검사점기술,채용일계렬우화기술래강저압축인입적계산연시,포괄:류수선식쌍중사완존대렬、문건사조작적합병、GPU가속적류수압축산법화GPU자원적다진정조도,등등.본문개소료해기술재천하일호계통중적실현,병대소실현적검사점계통진행종합평측.실험수거표명해방법재대규모이구병행계산계통중시가행、고효、실용적.