湖南大学学报(自然科学版)
湖南大學學報(自然科學版)
호남대학학보(자연과학판)
JOURNAL OF HUNAN UNIVERSITY(NATURAL SCIENCES EDITION)
2015年
8期
100-107
,共8页
王绍刚%徐炜遐%吴丹%庞征斌%夏军
王紹剛%徐煒遐%吳丹%龐徵斌%夏軍
왕소강%서위하%오단%방정빈%하군
远程内存访问%RDMA%MPI%滑动窗口
遠程內存訪問%RDMA%MPI%滑動窗口
원정내존방문%RDMA%MPI%활동창구
remote data memory access%RDMA%MPI%sliding window approach
大数据量的远程内存访问(RDMA)传输是并行计算机中最基本的通信模式之一,对系统整体性能的影响很大。随着并行计算机系统的规模扩大,系统的容错性设计面临着很大的挑战,互连网络具有链路不可靠、自适应路由等特点,如何面向不可靠网络实现可靠的端到端 RDMA 传输是并行系统体系结构设计的一大难题。提出一种面向不可靠网络下的快速 RDMA 传输方法,方法能够在节点控制器芯片上高效实现,对上层驱动软件和应用提供可靠的端到端 RDMA 传输服务。与传统的建立连接的方法相比,方法的硬件设计复杂度大大降低;方法另一优点是实现了按需重传,避免了传统方法中一次 RDMA 传输出现错误时,需要重传整个 RDMA 数据的开销,在相同的错误概率下,新方法的传输效率得到了很大的提升。
大數據量的遠程內存訪問(RDMA)傳輸是併行計算機中最基本的通信模式之一,對繫統整體性能的影響很大。隨著併行計算機繫統的規模擴大,繫統的容錯性設計麵臨著很大的挑戰,互連網絡具有鏈路不可靠、自適應路由等特點,如何麵嚮不可靠網絡實現可靠的耑到耑 RDMA 傳輸是併行繫統體繫結構設計的一大難題。提齣一種麵嚮不可靠網絡下的快速 RDMA 傳輸方法,方法能夠在節點控製器芯片上高效實現,對上層驅動軟件和應用提供可靠的耑到耑 RDMA 傳輸服務。與傳統的建立連接的方法相比,方法的硬件設計複雜度大大降低;方法另一優點是實現瞭按需重傳,避免瞭傳統方法中一次 RDMA 傳輸齣現錯誤時,需要重傳整箇 RDMA 數據的開銷,在相同的錯誤概率下,新方法的傳輸效率得到瞭很大的提升。
대수거량적원정내존방문(RDMA)전수시병행계산궤중최기본적통신모식지일,대계통정체성능적영향흔대。수착병행계산궤계통적규모확대,계통적용착성설계면림착흔대적도전,호련망락구유련로불가고、자괄응로유등특점,여하면향불가고망락실현가고적단도단 RDMA 전수시병행계통체계결구설계적일대난제。제출일충면향불가고망락하적쾌속 RDMA 전수방법,방법능구재절점공제기심편상고효실현,대상층구동연건화응용제공가고적단도단 RDMA 전수복무。여전통적건립련접적방법상비,방법적경건설계복잡도대대강저;방법령일우점시실현료안수중전,피면료전통방법중일차 RDMA 전수출현착오시,수요중전정개 RDMA 수거적개소,재상동적착오개솔하,신방법적전수효솔득도료흔대적제승。
Large data RDMA (Remote Data Memory Access)transport is the most commonly used par-allel communication mode for parallel computers,which has great impact on the whole system perform-ance.As the system size increases,the fault-tolerate architecture design faces new challenges.The inter-connection network usually uses the adaptive routing mode and becomes more unreliable.This paper pro-posed a fast RDMA offload method for unreliable interconnection networks,which can be efficiently imple-mented on the NIC hardware and provides reliable RDMA communication for upper driver and programs. Compared with the traditional approaches,the hardware overhead is greatly reduced.Another benefit is that it can partially retransmit the fault data,which greatly reduces the whole RDMA delay.Simulation results show that the RDMA delay is greatly reduced,compared with the traditional methods.