计算机研究与发展
計算機研究與髮展
계산궤연구여발전
JOURNAL OF COMPUTER RESEARCH AND DEVELOPMENT
2013年
8期
1755-1761
,共7页
曹宏嘉%卢宇彤%谢旻%周恩强
曹宏嘉%盧宇彤%謝旻%週恩彊
조굉가%로우동%사민%주은강
高性能计算%并行作业启动%进程管理%MPI%可扩展性
高性能計算%併行作業啟動%進程管理%MPI%可擴展性
고성능계산%병행작업계동%진정관리%MPI%가확전성
high performance computing%parallel job startup%process management%MPI%scalability
随着高性能计算机系统与并行应用规模的不断增加,大规模并行作业的启动时间不能再被忽略不计.已有的研究给出了在Tianhe-1A系统上加载MPI作业的性能结果.通过分析作业启动在控制消息传递、文件访问、MPI环境初始化等各阶段的时间开销,发现对于大规模MPI作业而言,环境初始化时间是作业启动的主要开销.基于此发现进行了一些优化,减少MPI环境初始化时交换的数据量,并避免不必要的数据传输开销.显著地提高了并行作业启动的性能,进而提出了一种层次式的可扩展进程管理结构,以进一步增强作业启动的可扩展性.与其他主流MPI实现的进程管理机制的作业启动时间进行了比较.
隨著高性能計算機繫統與併行應用規模的不斷增加,大規模併行作業的啟動時間不能再被忽略不計.已有的研究給齣瞭在Tianhe-1A繫統上加載MPI作業的性能結果.通過分析作業啟動在控製消息傳遞、文件訪問、MPI環境初始化等各階段的時間開銷,髮現對于大規模MPI作業而言,環境初始化時間是作業啟動的主要開銷.基于此髮現進行瞭一些優化,減少MPI環境初始化時交換的數據量,併避免不必要的數據傳輸開銷.顯著地提高瞭併行作業啟動的性能,進而提齣瞭一種層次式的可擴展進程管理結構,以進一步增彊作業啟動的可擴展性.與其他主流MPI實現的進程管理機製的作業啟動時間進行瞭比較.
수착고성능계산궤계통여병행응용규모적불단증가,대규모병행작업적계동시간불능재피홀략불계.이유적연구급출료재Tianhe-1A계통상가재MPI작업적성능결과.통과분석작업계동재공제소식전체、문건방문、MPI배경초시화등각계단적시간개소,발현대우대규모MPI작업이언,배경초시화시간시작업계동적주요개소.기우차발현진행료일사우화,감소MPI배경초시화시교환적수거량,병피면불필요적수거전수개소.현저지제고료병행작업계동적성능,진이제출료일충층차식적가확전진정관리결구,이진일보증강작업계동적가확전성.여기타주류MPI실현적진정관리궤제적작업계동시간진행료비교.