仪器仪表学报
儀器儀錶學報
의기의표학보
CHINESE JOURNAL OF SCIENTIFIC INSTRUMENT
2012年
1期
97-104
,共8页
李熙铭%欧阳丹彤%白洪涛
李熙銘%歐暘丹彤%白洪濤
리희명%구양단동%백홍도
线性方程组%平方根共轭梯度算法%内外迭代子%混合精度%图形处理器
線性方程組%平方根共軛梯度算法%內外迭代子%混閤精度%圖形處理器
선성방정조%평방근공액제도산법%내외질대자%혼합정도%도형처리기
针对当前基于GPU的数值算法具有双精度数据性能低下的缺陷.提出了一种适于GPU统一计算架构Fermi-CUDA的混合精度平方根共轭梯度算法用以求解稀疏线性方程组.该算法采用单精度内迭代与双精度外迭代结合的方法,以充分利用GPU体系结构下单精度高性能和双精度高精度的优点.整个算法的计算部分完全在GPU端进行,减少了CPU和GPU之间的数据通信.实现了基于GPU的平方根共轭梯度法、Jacobi迭代法和Gauss-Seidel迭代法,分析它们作为内迭代算子对算法收敛性的影响.实验表明,该算法获得了与全双精度数据处理等同的计算精度,比GPU全双精度在浮点性能上提升近一倍,相对于CPU全双精度串行算法,最大加速比达到70以上.
針對噹前基于GPU的數值算法具有雙精度數據性能低下的缺陷.提齣瞭一種適于GPU統一計算架構Fermi-CUDA的混閤精度平方根共軛梯度算法用以求解稀疏線性方程組.該算法採用單精度內迭代與雙精度外迭代結閤的方法,以充分利用GPU體繫結構下單精度高性能和雙精度高精度的優點.整箇算法的計算部分完全在GPU耑進行,減少瞭CPU和GPU之間的數據通信.實現瞭基于GPU的平方根共軛梯度法、Jacobi迭代法和Gauss-Seidel迭代法,分析它們作為內迭代算子對算法收斂性的影響.實驗錶明,該算法穫得瞭與全雙精度數據處理等同的計算精度,比GPU全雙精度在浮點性能上提升近一倍,相對于CPU全雙精度串行算法,最大加速比達到70以上.
침대당전기우GPU적수치산법구유쌍정도수거성능저하적결함.제출료일충괄우GPU통일계산가구Fermi-CUDA적혼합정도평방근공액제도산법용이구해희소선성방정조.해산법채용단정도내질대여쌍정도외질대결합적방법,이충분이용GPU체계결구하단정도고성능화쌍정도고정도적우점.정개산법적계산부분완전재GPU단진행,감소료CPU화GPU지간적수거통신.실현료기우GPU적평방근공액제도법、Jacobi질대법화Gauss-Seidel질대법,분석타문작위내질대산자대산법수렴성적영향.실험표명,해산법획득료여전쌍정도수거처리등동적계산정도,비GPU전쌍정도재부점성능상제승근일배,상대우CPU전쌍정도천행산법,최대가속비체도70이상.