计算机研究与发展
計算機研究與髮展
계산궤연구여발전
JOURNAL OF COMPUTER RESEARCH AND DEVELOPMENT
2007年
10期
1709-1716
,共8页
谢旻%卢宇彤%周恩强%曹宏嘉%杨学军
謝旻%盧宇彤%週恩彊%曹宏嘉%楊學軍
사민%로우동%주은강%조굉가%양학군
容错技术%MPICH2%回卷恢复%协同式检查点%Lustre文件系统
容錯技術%MPICH2%迴捲恢複%協同式檢查點%Lustre文件繫統
용착기술%MPICH2%회권회복%협동식검사점%Lustre문건계통
基于协同式检查点的回卷恢复是在大规模并行计算机系统中得到采用的一项重要容错技术,其性能开销主要为协同协议和检查点映像存储所决定.描述了一个在MPICH2中实现的应用透明的并行检查点系统,相比已有的技术,该系统有以下特点:1) 协同协议操作利用了并行应用的近邻通信特性,通过虚连接方法减少协议的处理开销;2) 采用Lustre文件系统简化检查点映像文件管理的复杂性;3) 通过并行I/O操作提高性能,优化检查点映像的存储过程.实际应用的测试表明,该检查点系统具有较小的运行时间开销和良好的可扩展性.
基于協同式檢查點的迴捲恢複是在大規模併行計算機繫統中得到採用的一項重要容錯技術,其性能開銷主要為協同協議和檢查點映像存儲所決定.描述瞭一箇在MPICH2中實現的應用透明的併行檢查點繫統,相比已有的技術,該繫統有以下特點:1) 協同協議操作利用瞭併行應用的近鄰通信特性,通過虛連接方法減少協議的處理開銷;2) 採用Lustre文件繫統簡化檢查點映像文件管理的複雜性;3) 通過併行I/O操作提高性能,優化檢查點映像的存儲過程.實際應用的測試錶明,該檢查點繫統具有較小的運行時間開銷和良好的可擴展性.
기우협동식검사점적회권회복시재대규모병행계산궤계통중득도채용적일항중요용착기술,기성능개소주요위협동협의화검사점영상존저소결정.묘술료일개재MPICH2중실현적응용투명적병행검사점계통,상비이유적기술,해계통유이하특점:1) 협동협의조작이용료병행응용적근린통신특성,통과허련접방법감소협의적처리개소;2) 채용Lustre문건계통간화검사점영상문건관리적복잡성;3) 통과병행I/O조작제고성능,우화검사점영상적존저과정.실제응용적측시표명,해검사점계통구유교소적운행시간개소화량호적가확전성.