计算机应用研究
計算機應用研究
계산궤응용연구
APPLICATION RESEARCH OF COMPUTERS
2009年
11期
4115-4118
,共4页
左颢睿%张启衡%徐勇%赵汝进
左顥睿%張啟衡%徐勇%趙汝進
좌호예%장계형%서용%조여진
图形处理器%并行优化%累加和%统一计算设备架构
圖形處理器%併行優化%纍加和%統一計算設備架構
도형처리기%병행우화%루가화%통일계산설비가구
针对标准并行算法难以在图形处理器(GPU)上高效运行的问题,以累加和算法为例,基于Nvidia公司统一计算设备架构(CUDA)GPU介绍了指令优化、共享缓存冲突避免、解循环优化和线程过载优化四种优化方法.实验结果表明,并行优化能有效提高算法在GPU上的执行效率,优化后累加和算法的运算速度相比标准并行算法提高了约34倍,相比CPU串行实现提高了约70倍.
針對標準併行算法難以在圖形處理器(GPU)上高效運行的問題,以纍加和算法為例,基于Nvidia公司統一計算設備架構(CUDA)GPU介紹瞭指令優化、共享緩存遲突避免、解循環優化和線程過載優化四種優化方法.實驗結果錶明,併行優化能有效提高算法在GPU上的執行效率,優化後纍加和算法的運算速度相比標準併行算法提高瞭約34倍,相比CPU串行實現提高瞭約70倍.
침대표준병행산법난이재도형처리기(GPU)상고효운행적문제,이루가화산법위례,기우Nvidia공사통일계산설비가구(CUDA)GPU개소료지령우화、공향완존충돌피면、해순배우화화선정과재우화사충우화방법.실험결과표명,병행우화능유효제고산법재GPU상적집행효솔,우화후루가화산법적운산속도상비표준병행산법제고료약34배,상비CPU천행실현제고료약70배.