计算机工程与科学
計算機工程與科學
계산궤공정여과학
COMPUTER ENGINEERING & SCIENCE
2014年
12期
2267-2271
,共5页
迟利华%胡庆丰%刘杰%甘新标%蒋杰%晏益慧
遲利華%鬍慶豐%劉傑%甘新標%蔣傑%晏益慧
지리화%호경봉%류걸%감신표%장걸%안익혜
多线程微处理器%STREAM测试程序%性能优化
多線程微處理器%STREAM測試程序%性能優化
다선정미처리기%STREAM측시정서%성능우화
multithreaded processor%STREAM benchmark%performance optimization
STREAM是微处理器上内存性能的基准测试程序,在多核多线程FT1000微处理器上发挥高性能是具有挑战性的研究工作.基于多级Cache结构,优化STREAM四个程序的指令流水线,根据寄存器数,设计了多级循环展开方法,根据指令延迟和Cache行的大小确定数据预取的数目,使用汇编语言编写了优化子程序.基于OpenMP并行环境,设计了STREAM并行程序,优化了局部化数据分配方式.数据测试结果表明,优化后的STREAM的性能比原始串行程序性能提高了19.2%~64.2%.优化后,并行程序的最高访存性能达到8.5 GB/s,对比优化前的最高访存性能最大提高了22.7%.
STREAM是微處理器上內存性能的基準測試程序,在多覈多線程FT1000微處理器上髮揮高性能是具有挑戰性的研究工作.基于多級Cache結構,優化STREAM四箇程序的指令流水線,根據寄存器數,設計瞭多級循環展開方法,根據指令延遲和Cache行的大小確定數據預取的數目,使用彙編語言編寫瞭優化子程序.基于OpenMP併行環境,設計瞭STREAM併行程序,優化瞭跼部化數據分配方式.數據測試結果錶明,優化後的STREAM的性能比原始串行程序性能提高瞭19.2%~64.2%.優化後,併行程序的最高訪存性能達到8.5 GB/s,對比優化前的最高訪存性能最大提高瞭22.7%.
STREAM시미처리기상내존성능적기준측시정서,재다핵다선정FT1000미처리기상발휘고성능시구유도전성적연구공작.기우다급Cache결구,우화STREAM사개정서적지령류수선,근거기존기수,설계료다급순배전개방법,근거지령연지화Cache행적대소학정수거예취적수목,사용회편어언편사료우화자정서.기우OpenMP병행배경,설계료STREAM병행정서,우화료국부화수거분배방식.수거측시결과표명,우화후적STREAM적성능비원시천행정서성능제고료19.2%~64.2%.우화후,병행정서적최고방존성능체도8.5 GB/s,대비우화전적최고방존성능최대제고료22.7%.