计算机工程与科学
計算機工程與科學
계산궤공정여과학
COMPUTER ENGINEERING & SCIENCE
2012年
7期
78-83
,共6页
秦晋%龚春叶%胡庆丰%刘杰
秦晉%龔春葉%鬍慶豐%劉傑
진진%공춘협%호경봉%류걸
GPU%CDIA%CUDA%稀疏矩阵向量乘
GPU%CDIA%CUDA%稀疏矩陣嚮量乘
GPU%CDIA%CUDA%희소구진향량승
稀疏矩阵向量乘是很多科学计算问题中的核心问题.本文针对稀疏对角矩阵,在DIA存储格式的基础上,设计了一种新型压缩存储格式CDIA,结合CUDA编程模型的特点,在计算线程上进行了细粒度的任务分配,同时为满足CUDA对存储器的合并访问要求,将压缩矩阵做了相应的转置处理,设计了细粒度算法与程序,并根据稀疏矩阵向量乘特点,做了相应的程序优化.实验数据显示,这种存储格式能够很好地发挥CUDA在数据处理方面的优势,在测试数据中,最高获得了单精度39.6 Gflop/s和双精度19.6 Gflop/s的浮点计算性能,性能在Nathan Bell和Michael Garland的基础上分别提高了7.6%和17.4%.
稀疏矩陣嚮量乘是很多科學計算問題中的覈心問題.本文針對稀疏對角矩陣,在DIA存儲格式的基礎上,設計瞭一種新型壓縮存儲格式CDIA,結閤CUDA編程模型的特點,在計算線程上進行瞭細粒度的任務分配,同時為滿足CUDA對存儲器的閤併訪問要求,將壓縮矩陣做瞭相應的轉置處理,設計瞭細粒度算法與程序,併根據稀疏矩陣嚮量乘特點,做瞭相應的程序優化.實驗數據顯示,這種存儲格式能夠很好地髮揮CUDA在數據處理方麵的優勢,在測試數據中,最高穫得瞭單精度39.6 Gflop/s和雙精度19.6 Gflop/s的浮點計算性能,性能在Nathan Bell和Michael Garland的基礎上分彆提高瞭7.6%和17.4%.
희소구진향량승시흔다과학계산문제중적핵심문제.본문침대희소대각구진,재DIA존저격식적기출상,설계료일충신형압축존저격식CDIA,결합CUDA편정모형적특점,재계산선정상진행료세립도적임무분배,동시위만족CUDA대존저기적합병방문요구,장압축구진주료상응적전치처리,설계료세립도산법여정서,병근거희소구진향량승특점,주료상응적정서우화.실험수거현시,저충존저격식능구흔호지발휘CUDA재수거처리방면적우세,재측시수거중,최고획득료단정도39.6 Gflop/s화쌍정도19.6 Gflop/s적부점계산성능,성능재Nathan Bell화Michael Garland적기출상분별제고료7.6%화17.4%.