科学技术与工程
科學技術與工程
과학기술여공정
Science Technology and Engineering
2015年
29期
158-163,173
,共7页
沈聪%曹婷%宋金文%高火涛
瀋聰%曹婷%宋金文%高火濤
침총%조정%송금문%고화도
海森伯格约化%混合系统%混合调度%加速比
海森伯格約化%混閤繫統%混閤調度%加速比
해삼백격약화%혼합계통%혼합조도%가속비
Hessenberg reduction%hybrid system%hybrid scheduling%speedup
求解一般矩阵特征值问题的第一步即进行Hessenberg约化。给出了矩阵的Hessenberg约化算法在GPU上实现的具体方案。针对CPU-GPU混合系统,对基于块计算的Hessenberg约化算法进行了计算任务的划分,并通过详细分析每次循环时各任务的计算量,设计了一种较为合理的分阶段混合调度策略。数值实验表明,使用CPU-GPU混合调度的方案相比直接使用CUBLAS库方案平均获得了约47%的性能提升,而且相比使用CPU上标准的BLAS库函数最高获得了超过7倍的加速比。
求解一般矩陣特徵值問題的第一步即進行Hessenberg約化。給齣瞭矩陣的Hessenberg約化算法在GPU上實現的具體方案。針對CPU-GPU混閤繫統,對基于塊計算的Hessenberg約化算法進行瞭計算任務的劃分,併通過詳細分析每次循環時各任務的計算量,設計瞭一種較為閤理的分階段混閤調度策略。數值實驗錶明,使用CPU-GPU混閤調度的方案相比直接使用CUBLAS庫方案平均穫得瞭約47%的性能提升,而且相比使用CPU上標準的BLAS庫函數最高穫得瞭超過7倍的加速比。
구해일반구진특정치문제적제일보즉진행Hessenberg약화。급출료구진적Hessenberg약화산법재GPU상실현적구체방안。침대CPU-GPU혼합계통,대기우괴계산적Hessenberg약화산법진행료계산임무적화분,병통과상세분석매차순배시각임무적계산량,설계료일충교위합리적분계단혼합조도책략。수치실험표명,사용CPU-GPU혼합조도적방안상비직접사용CUBLAS고방안평균획득료약47%적성능제승,이차상비사용CPU상표준적BLAS고함수최고획득료초과7배적가속비。
The first step of solving the eigenvalue problem of a nonsymmetric matirx is to reduce the matrix to an upper Hessenberg form .A concretely plan is designed for the reduction of a matrix on GPU .For the CPU-GPU hy-brid system, The whole work of the block hessenberg reduction algorithm is split into several tasks .The computa-tional complexity of each task in each loop is analyzed , and then a more reasonable scheduling strategy is presen-ted.The numerical experiment shows that the algorithm using the hybrid scheduling plan presented acquires about 47 percentage of performance improvement compared with the orginal transplant plan using CUBLAS only in aver -age.Also it achieves a speedup of more than 7 times than that of the current BLAS library .