计算机科学
計算機科學
계산궤과학
COMPUTER SCIENCE
2010年
8期
168-171,181
,共5页
白洪涛%欧阳丹彤%李熙铭%李亭%何丽莉
白洪濤%歐暘丹彤%李熙銘%李亭%何麗莉
백홍도%구양단동%리희명%리정%하려리
稀疏矩阵%行压缩存储%图形处理器%统一计算架构%优化策略
稀疏矩陣%行壓縮存儲%圖形處理器%統一計算架構%優化策略
희소구진%행압축존저%도형처리기%통일계산가구%우화책략
针对稀疏矩阵运算难以发挥图形处理器的强大运算能力的现状,基于图形处理器的统一计算架构,在线程映射、数据复用等方面研究了一系列并行计算优化方法,从而完成了一种行压缩存储表示下的稀疏矩阵向量乘并行算法.这些优化方法包括:(1)利用Warp内线程天然同步特性,Half-warp完成结果向量一个元素的计算;(2)取整读取数据,实现合并访问;(3)输入向量放入纹理存储器,数据复用;(4)申请分页锁定内存,加速数据传输;(5)使用共享存储器,加速数据存取.实验分析表明,提出的各种手段起到了优化的作用.与已有的CUDPP和SpMV library中的CSR-vector算法相比,本算法获得了更高的存储器带宽和浮点运算吞吐量;整体性能比CPU串行执行版本快了3倍以上.
針對稀疏矩陣運算難以髮揮圖形處理器的彊大運算能力的現狀,基于圖形處理器的統一計算架構,在線程映射、數據複用等方麵研究瞭一繫列併行計算優化方法,從而完成瞭一種行壓縮存儲錶示下的稀疏矩陣嚮量乘併行算法.這些優化方法包括:(1)利用Warp內線程天然同步特性,Half-warp完成結果嚮量一箇元素的計算;(2)取整讀取數據,實現閤併訪問;(3)輸入嚮量放入紋理存儲器,數據複用;(4)申請分頁鎖定內存,加速數據傳輸;(5)使用共享存儲器,加速數據存取.實驗分析錶明,提齣的各種手段起到瞭優化的作用.與已有的CUDPP和SpMV library中的CSR-vector算法相比,本算法穫得瞭更高的存儲器帶寬和浮點運算吞吐量;整體性能比CPU串行執行版本快瞭3倍以上.
침대희소구진운산난이발휘도형처리기적강대운산능력적현상,기우도형처리기적통일계산가구,재선정영사、수거복용등방면연구료일계렬병행계산우화방법,종이완성료일충행압축존저표시하적희소구진향량승병행산법.저사우화방법포괄:(1)이용Warp내선정천연동보특성,Half-warp완성결과향량일개원소적계산;(2)취정독취수거,실현합병방문;(3)수입향량방입문리존저기,수거복용;(4)신청분혈쇄정내존,가속수거전수;(5)사용공향존저기,가속수거존취.실험분석표명,제출적각충수단기도료우화적작용.여이유적CUDPP화SpMV library중적CSR-vector산법상비,본산법획득료경고적존저기대관화부점운산탄토량;정체성능비CPU천행집행판본쾌료3배이상.