计算机科学
計算機科學
계산궤과학
COMPUTER SCIENCE
2014年
6期
12-17
,共6页
许瑾晨%郭绍忠%黄永忠%王磊
許瑾晨%郭紹忠%黃永忠%王磊
허근신%곽소충%황영충%왕뢰
异构众核%数学函数库%访存优化%指令调度%局部数据存储空间
異構衆覈%數學函數庫%訪存優化%指令調度%跼部數據存儲空間
이구음핵%수학함수고%방존우화%지령조도%국부수거존저공간
Heterogeneous many-core%Mathematical library%Access optimization%Instruction-scheduling%Local data memory
数学库函数算法的特性致使函数存在大量的访存,而当前异构众核的从核结构采用共享主存的方式实现数据访问,从而严重影响了从核的访存速度,因此异构众核结构中数学库函数的性能无法满足高性能计算的要求.为了有效解决此问题,提出了一种基于访存指令的调度策略,亦即将访存延迟有效地隐藏于计算延迟中,以提高基于汇编实现的数学函数库的函数性能;结合动态调用方式,利用从核本地局部数据存储空间LDM(local data memory),提出了一种提高访存速度的ldm_call算法.两种优化技术在共享存储结构下具有普遍适用性,并能够有效减少函数访存开销,提高访存速度.实验表明,两种技术分别能够平均提高函数性能16.08%和37.32%.
數學庫函數算法的特性緻使函數存在大量的訪存,而噹前異構衆覈的從覈結構採用共享主存的方式實現數據訪問,從而嚴重影響瞭從覈的訪存速度,因此異構衆覈結構中數學庫函數的性能無法滿足高性能計算的要求.為瞭有效解決此問題,提齣瞭一種基于訪存指令的調度策略,亦即將訪存延遲有效地隱藏于計算延遲中,以提高基于彙編實現的數學函數庫的函數性能;結閤動態調用方式,利用從覈本地跼部數據存儲空間LDM(local data memory),提齣瞭一種提高訪存速度的ldm_call算法.兩種優化技術在共享存儲結構下具有普遍適用性,併能夠有效減少函數訪存開銷,提高訪存速度.實驗錶明,兩種技術分彆能夠平均提高函數性能16.08%和37.32%.
수학고함수산법적특성치사함수존재대량적방존,이당전이구음핵적종핵결구채용공향주존적방식실현수거방문,종이엄중영향료종핵적방존속도,인차이구음핵결구중수학고함수적성능무법만족고성능계산적요구.위료유효해결차문제,제출료일충기우방존지령적조도책략,역즉장방존연지유효지은장우계산연지중,이제고기우회편실현적수학함수고적함수성능;결합동태조용방식,이용종핵본지국부수거존저공간LDM(local data memory),제출료일충제고방존속도적ldm_call산법.량충우화기술재공향존저결구하구유보편괄용성,병능구유효감소함수방존개소,제고방존속도.실험표명,량충기술분별능구평균제고함수성능16.08%화37.32%.