计算机学报
計算機學報
계산궤학보
CHINESE JOURNAL OF COMPUTERS
2008年
10期
1727-1736
,共10页
曹政%王达伟%刘新春%孙凝晖
曹政%王達偉%劉新春%孫凝暉
조정%왕체위%류신춘%손응휘
高性能计算机%多级互联网络%胖树%Barrier%同步%归约%分发%可靠
高性能計算機%多級互聯網絡%胖樹%Barrier%同步%歸約%分髮%可靠
고성능계산궤%다급호련망락%반수%Barrier%동보%귀약%분발%가고
为优化Barrier操作的性能,提高大规模并行计算应用在曙光5000系统中的执行效率,文中提出了一种基于硬件的Barrier加速设计.该设计是采用树形Barrier算法,通过增强曙光5000互联网络交换芯片的功能,实现低延迟、可扩展、高可靠和可管理的Barrier网络.该网络支持并发16个Barrier操作,可在FaPTree拓扑环境下实现较低的Barrier操作延迟.相比已有实现,是更适合Fat-Tree拓扑的设计方案.理想情况下,1024个节点的同步操作在1.7ps内完成.根据Barrier操作归约和分发过程的特点,分别采用请求应答和超时催促两种机制,为Barrier操作的可靠性提供保障.以该设计实现的Barrier网络原型系统已通过FPGA验证.
為優化Barrier操作的性能,提高大規模併行計算應用在曙光5000繫統中的執行效率,文中提齣瞭一種基于硬件的Barrier加速設計.該設計是採用樹形Barrier算法,通過增彊曙光5000互聯網絡交換芯片的功能,實現低延遲、可擴展、高可靠和可管理的Barrier網絡.該網絡支持併髮16箇Barrier操作,可在FaPTree拓撲環境下實現較低的Barrier操作延遲.相比已有實現,是更適閤Fat-Tree拓撲的設計方案.理想情況下,1024箇節點的同步操作在1.7ps內完成.根據Barrier操作歸約和分髮過程的特點,分彆採用請求應答和超時催促兩種機製,為Barrier操作的可靠性提供保障.以該設計實現的Barrier網絡原型繫統已通過FPGA驗證.
위우화Barrier조작적성능,제고대규모병행계산응용재서광5000계통중적집행효솔,문중제출료일충기우경건적Barrier가속설계.해설계시채용수형Barrier산법,통과증강서광5000호련망락교환심편적공능,실현저연지、가확전、고가고화가관리적Barrier망락.해망락지지병발16개Barrier조작,가재FaPTree탁복배경하실현교저적Barrier조작연지.상비이유실현,시경괄합Fat-Tree탁복적설계방안.이상정황하,1024개절점적동보조작재1.7ps내완성.근거Barrier조작귀약화분발과정적특점,분별채용청구응답화초시최촉량충궤제,위Barrier조작적가고성제공보장.이해설계실현적Barrier망락원형계통이통과FPGA험증.