计算机工程与科学
計算機工程與科學
계산궤공정여과학
COMPUTER ENGINEERING & SCIENCE
2015年
1期
1-6
,共6页
林彦宇%陈虎%苗军%韩佳龙媚%赖路双
林彥宇%陳虎%苗軍%韓佳龍媚%賴路雙
림언우%진호%묘군%한가룡미%뢰로쌍
可靠性%可扩展性%服务性%大规模集群%并行计算软件
可靠性%可擴展性%服務性%大規模集群%併行計算軟件
가고성%가확전성%복무성%대규모집군%병행계산연건
availability%scalability%serviceability%large scale cluster%parallel computing software
大规模集群上的并行计算软件需要具备处理部分节点、网络等失效的容错能力,也需要具有易于管理、维护、移植和可扩展的服务能力.针对星形计算模型,研究和开发了一套并行计算框架.利用调度节点内部的可变粒度分解器、相关队列等方法,实现了全系统容错,且具有较好的易用性、可移植性和可扩展性.系统目前可以实现300 TFlops计算能力下连续运行超过150 h,而且还具有进一步的可扩展能力.
大規模集群上的併行計算軟件需要具備處理部分節點、網絡等失效的容錯能力,也需要具有易于管理、維護、移植和可擴展的服務能力.針對星形計算模型,研究和開髮瞭一套併行計算框架.利用調度節點內部的可變粒度分解器、相關隊列等方法,實現瞭全繫統容錯,且具有較好的易用性、可移植性和可擴展性.繫統目前可以實現300 TFlops計算能力下連續運行超過150 h,而且還具有進一步的可擴展能力.
대규모집군상적병행계산연건수요구비처리부분절점、망락등실효적용착능력,야수요구유역우관리、유호、이식화가확전적복무능력.침대성형계산모형,연구화개발료일투병행계산광가.이용조도절점내부적가변립도분해기、상관대렬등방법,실현료전계통용착,차구유교호적역용성、가이식성화가확전성.계통목전가이실현300 TFlops계산능력하련속운행초과150 h,이차환구유진일보적가확전능력.