计算机系统应用
計算機繫統應用
계산궤계통응용
APPLICATIONS OF THE COMPUTER SYSTEMS
2011年
1期
163-167
,共5页
龙芯3A%BLAS%优化%Gemv%Ger%访存%多线程
龍芯3A%BLAS%優化%Gemv%Ger%訪存%多線程
룡심3A%BLAS%우화%Gemv%Ger%방존%다선정
针对龙芯3A体系结构以及二级BLAS库函数的特点,在指令级、存储级和线程级抽取并行方案,总结了一些合适的优化方法,并对其进行了定量的分析.实验表明,这些优化可以将二级BLAS函数单线程的性能提升20%以上,多线程下也可以得到2.5倍左右的加速比,这对今后多核龙芯上的系统软件优化工作有着一定的帮助.
針對龍芯3A體繫結構以及二級BLAS庫函數的特點,在指令級、存儲級和線程級抽取併行方案,總結瞭一些閤適的優化方法,併對其進行瞭定量的分析.實驗錶明,這些優化可以將二級BLAS函數單線程的性能提升20%以上,多線程下也可以得到2.5倍左右的加速比,這對今後多覈龍芯上的繫統軟件優化工作有著一定的幫助.
침대룡심3A체계결구이급이급BLAS고함수적특점,재지령급、존저급화선정급추취병행방안,총결료일사합괄적우화방법,병대기진행료정량적분석.실험표명,저사우화가이장이급BLAS함수단선정적성능제승20%이상,다선정하야가이득도2.5배좌우적가속비,저대금후다핵룡심상적계통연건우화공작유착일정적방조.