计算机研究与发展
計算機研究與髮展
계산궤연구여발전
JOURNAL OF COMPUTER RESEARCH AND DEVELOPMENT
2014年
3期
672-680
,共9页
钟祺%王晶%管雪涛%黄涛%王克义
鐘祺%王晶%管雪濤%黃濤%王剋義
종기%왕정%관설도%황도%왕극의
访存冲突%操作系统%rank聚簇%内存分配%数据对象
訪存遲突%操作繫統%rank聚簇%內存分配%數據對象
방존충돌%조작계통%rank취족%내존분배%수거대상
memory interference%operating system%rank cluster%memory allocation%data object
利用主存的多bank/rank/channel结构挖掘访存并行性和局部性,是提高系统性能的重要手段.相关研究工作通过sub-rank技术增加可并行工作的存储资源,或在并行程序之间对bank划分,以隔离访存冲突.但上述方法没有考虑在bank/rank资源共存的情况下,单个程序内部数据对象间的冲突问题.通过观察数据在主存中的分布,发现程序的数据倾向聚簇于单个rank中,并提出了一种基于数据对象规模的rank级内存分配方法(data object scale aware rank-level memory allocation,DSRA).DSRA将冲突开销较大的数据对象分散到不同的rank,利用增长的bank/rank资源提高访存性能.DSRA工作在操作系统层,基于编译器和操作系统提供的信息来分析数据对象间的冲突开销,既不用修改源码,也不依赖特殊的底层硬件.基于2款真实处理器对来自NAS Benchmark和SPEC CPU2000中的存储敏感型基准测试程序进行评测.结果表明,在不影响cache失效率的情况下,DSRA通过减少主存访问周期数,可以降低程序的执行时间.与已有的优化技术相比,性能平均提高6.8%,最高性能提升幅度为16%.
利用主存的多bank/rank/channel結構挖掘訪存併行性和跼部性,是提高繫統性能的重要手段.相關研究工作通過sub-rank技術增加可併行工作的存儲資源,或在併行程序之間對bank劃分,以隔離訪存遲突.但上述方法沒有攷慮在bank/rank資源共存的情況下,單箇程序內部數據對象間的遲突問題.通過觀察數據在主存中的分佈,髮現程序的數據傾嚮聚簇于單箇rank中,併提齣瞭一種基于數據對象規模的rank級內存分配方法(data object scale aware rank-level memory allocation,DSRA).DSRA將遲突開銷較大的數據對象分散到不同的rank,利用增長的bank/rank資源提高訪存性能.DSRA工作在操作繫統層,基于編譯器和操作繫統提供的信息來分析數據對象間的遲突開銷,既不用脩改源碼,也不依賴特殊的底層硬件.基于2款真實處理器對來自NAS Benchmark和SPEC CPU2000中的存儲敏感型基準測試程序進行評測.結果錶明,在不影響cache失效率的情況下,DSRA通過減少主存訪問週期數,可以降低程序的執行時間.與已有的優化技術相比,性能平均提高6.8%,最高性能提升幅度為16%.
이용주존적다bank/rank/channel결구알굴방존병행성화국부성,시제고계통성능적중요수단.상관연구공작통과sub-rank기술증가가병행공작적존저자원,혹재병행정서지간대bank화분,이격리방존충돌.단상술방법몰유고필재bank/rank자원공존적정황하,단개정서내부수거대상간적충돌문제.통과관찰수거재주존중적분포,발현정서적수거경향취족우단개rank중,병제출료일충기우수거대상규모적rank급내존분배방법(data object scale aware rank-level memory allocation,DSRA).DSRA장충돌개소교대적수거대상분산도불동적rank,이용증장적bank/rank자원제고방존성능.DSRA공작재조작계통층,기우편역기화조작계통제공적신식래분석수거대상간적충돌개소,기불용수개원마,야불의뢰특수적저층경건.기우2관진실처리기대래자NAS Benchmark화SPEC CPU2000중적존저민감형기준측시정서진행평측.결과표명,재불영향cache실효솔적정황하,DSRA통과감소주존방문주기수,가이강저정서적집행시간.여이유적우화기술상비,성능평균제고6.8%,최고성능제승폭도위16%.