计算机工程与设计
計算機工程與設計
계산궤공정여설계
COMPUTER ENGINEERING AND DESIGN
2011年
9期
3050-3053,3169
,共5页
李正杰%徐炜民%柴亚辉%郑衍衡
李正傑%徐煒民%柴亞輝%鄭衍衡
리정걸%서위민%시아휘%정연형
图形处理器%异构体系结构%统一计算架构%快速多极子算法%PP问题
圖形處理器%異構體繫結構%統一計算架構%快速多極子算法%PP問題
도형처리기%이구체계결구%통일계산가구%쾌속다겁자산법%PP문제
针对目前快速多极子算法中PP问题在图形处理器上实现的缺点,如负载不平衡和计算规模受显存大小的限制等,提出了一种新的基于统一计算设备架构平台的实现方法.采取以Box为并行单位、在内存中开辟缓冲区与多线程流水计算等方式,使其适合于CPU和GPU组成的异构体系结构,充分利用CUDA编程模型的高并行性加速PP问题.实验结果表明,采用CUDA加速后,PP问题的计算时间明显降低,提高了整个FMM模拟效率,适合于各种多体问题的实时模拟.
針對目前快速多極子算法中PP問題在圖形處理器上實現的缺點,如負載不平衡和計算規模受顯存大小的限製等,提齣瞭一種新的基于統一計算設備架構平檯的實現方法.採取以Box為併行單位、在內存中開闢緩遲區與多線程流水計算等方式,使其適閤于CPU和GPU組成的異構體繫結構,充分利用CUDA編程模型的高併行性加速PP問題.實驗結果錶明,採用CUDA加速後,PP問題的計算時間明顯降低,提高瞭整箇FMM模擬效率,適閤于各種多體問題的實時模擬.
침대목전쾌속다겁자산법중PP문제재도형처리기상실현적결점,여부재불평형화계산규모수현존대소적한제등,제출료일충신적기우통일계산설비가구평태적실현방법.채취이Box위병행단위、재내존중개벽완충구여다선정류수계산등방식,사기괄합우CPU화GPU조성적이구체계결구,충분이용CUDA편정모형적고병행성가속PP문제.실험결과표명,채용CUDA가속후,PP문제적계산시간명현강저,제고료정개FMM모의효솔,괄합우각충다체문제적실시모의.