软件学报
軟件學報
연건학보
JOURNAL OF SOFTWARE
2011年
10期
2538-2552
,共15页
徐新海%杨学军%林宇斐%林一松%唐滔
徐新海%楊學軍%林宇斐%林一鬆%唐滔
서신해%양학군%림우비%림일송%당도
GPGPU%异构系统%容错%Lazy策略%检查点
GPGPU%異構繫統%容錯%Lazy策略%檢查點
GPGPU%이구계통%용착%Lazy책략%검사점
近年来,为了缓解日益严重的功耗问题,异构并行体系结构已成为超级计算机发展的一个重要趋势.图形处理器(graphics processing unit,简称GPU)凭借其超高的计算性能和性能功耗比,作为一种高效的加速部件已被广泛应用于高性能计算领域.但是,GPU先天的可靠性缺陷势必加剧超级计算机的可靠性问题.目前,国际上关于CPU-GPU异构系统容错技术的研究工作主要将GPU从异构系统中独立出来,以每次调用为粒度对其进行容错处理.设计了一种面向CPU-GPU异构系统的Lazy容错方法,给出了基于编译指导命令的容错框架及其约束,并讨论了相关的编译实现和优化方法,最后通过实验验证了该方法的正确性.实验结果表明,与现有的容错方法相比,利用所设计的LazyFT容错方法对GPGPU(general purpose computation on graphics hardware)程序进行容错处理,可以明显降低容错代价.
近年來,為瞭緩解日益嚴重的功耗問題,異構併行體繫結構已成為超級計算機髮展的一箇重要趨勢.圖形處理器(graphics processing unit,簡稱GPU)憑藉其超高的計算性能和性能功耗比,作為一種高效的加速部件已被廣汎應用于高性能計算領域.但是,GPU先天的可靠性缺陷勢必加劇超級計算機的可靠性問題.目前,國際上關于CPU-GPU異構繫統容錯技術的研究工作主要將GPU從異構繫統中獨立齣來,以每次調用為粒度對其進行容錯處理.設計瞭一種麵嚮CPU-GPU異構繫統的Lazy容錯方法,給齣瞭基于編譯指導命令的容錯框架及其約束,併討論瞭相關的編譯實現和優化方法,最後通過實驗驗證瞭該方法的正確性.實驗結果錶明,與現有的容錯方法相比,利用所設計的LazyFT容錯方法對GPGPU(general purpose computation on graphics hardware)程序進行容錯處理,可以明顯降低容錯代價.
근년래,위료완해일익엄중적공모문제,이구병행체계결구이성위초급계산궤발전적일개중요추세.도형처리기(graphics processing unit,간칭GPU)빙차기초고적계산성능화성능공모비,작위일충고효적가속부건이피엄범응용우고성능계산영역.단시,GPU선천적가고성결함세필가극초급계산궤적가고성문제.목전,국제상관우CPU-GPU이구계통용착기술적연구공작주요장GPU종이구계통중독립출래,이매차조용위립도대기진행용착처리.설계료일충면향CPU-GPU이구계통적Lazy용착방법,급출료기우편역지도명령적용착광가급기약속,병토론료상관적편역실현화우화방법,최후통과실험험증료해방법적정학성.실험결과표명,여현유적용착방법상비,이용소설계적LazyFT용착방법대GPGPU(general purpose computation on graphics hardware)정서진행용착처리,가이명현강저용착대개.