集成技术
集成技術
집성기술
Journal of Integration Technology
2012年
1期
84-88
,共5页
罗力%杨超%赵宇波%蔡小川
囉力%楊超%趙宇波%蔡小川
라력%양초%조우파%채소천
PDEs%CPU/GPU集群%区域分解%代数多重网格%可扩展算法
PDEs%CPU/GPU集群%區域分解%代數多重網格%可擴展算法
PDEs%CPU/GPU집군%구역분해%대수다중망격%가확전산법
当前世界上排前几位的超级计算机都基于大量CPU和GPU组合的混合架构,它们对某些特殊问题,譬如基于FFT的图像处理或N体颗粒计算等领域可获得很高的性能.但是对由有限差分(或基于网格的有限元)离散的偏微分方程问题,于CPU/GPU集群上获得较好的性能仍然是一种挑战.本文提出并测试一种基于这类集群架构的混合算法.算法的可扩展性通过区域分解算法实现,而GPU的性能由基于光滑聚集的代数多重网格法获得,避免了在GPU上表现不理想的不完全分解算法.本文的数值实验采用32 CPU/GPU求解用差分离散后达三千万未知数的偏微分方程.
噹前世界上排前幾位的超級計算機都基于大量CPU和GPU組閤的混閤架構,它們對某些特殊問題,譬如基于FFT的圖像處理或N體顆粒計算等領域可穫得很高的性能.但是對由有限差分(或基于網格的有限元)離散的偏微分方程問題,于CPU/GPU集群上穫得較好的性能仍然是一種挑戰.本文提齣併測試一種基于這類集群架構的混閤算法.算法的可擴展性通過區域分解算法實現,而GPU的性能由基于光滑聚集的代數多重網格法穫得,避免瞭在GPU上錶現不理想的不完全分解算法.本文的數值實驗採用32 CPU/GPU求解用差分離散後達三韆萬未知數的偏微分方程.
당전세계상배전궤위적초급계산궤도기우대량CPU화GPU조합적혼합가구,타문대모사특수문제,비여기우FFT적도상처리혹N체과립계산등영역가획득흔고적성능.단시대유유한차분(혹기우망격적유한원)리산적편미분방정문제,우CPU/GPU집군상획득교호적성능잉연시일충도전.본문제출병측시일충기우저류집군가구적혼합산법.산법적가확전성통과구역분해산법실현,이GPU적성능유기우광활취집적대수다중망격법획득,피면료재GPU상표현불이상적불완전분해산법.본문적수치실험채용32 CPU/GPU구해용차분리산후체삼천만미지수적편미분방정.