计算机与数字工程
計算機與數字工程
계산궤여수자공정
Computer and Digital Engineering
2015年
10期
1775-1779,1823
,共6页
宋庆增%张二路%韩冬%吕华阳%武继刚
宋慶增%張二路%韓鼕%呂華暘%武繼剛
송경증%장이로%한동%려화양%무계강
FDTD 算法%CUDA%Roofline模型%GPU
FDTD 算法%CUDA%Roofline模型%GPU
FDTD 산법%CUDA%Roofline모형%GPU
FDTD algorithm%CUDA%Roofline model%GPU
FD T D算法是电磁场领域使用非常广泛的数值计算方法,该方法具有很好的精度与灵活性,已成为求解各种电磁场问题的有力工具。半导体技术的快速发展使得 CPU 的计算性能有了飞跃性的进步,但是直到现在 FDTD 法的在CPU 上的计算时间依旧非常耗时,这极大地限制了 FDTD 法在各种工程领域里的应用。论文主要在 GPU 上实现和优化FDTD 算法,从而提高 FDTD 方法的计算效率,节省仿真时间。实验结果表明相对 Intel Xeon 处理器上执行的串行程序, GPU 最高可获得166倍的加速。同时根据 Roofline 模型,GPU 性能达到理论值的89%。
FD T D算法是電磁場領域使用非常廣汎的數值計算方法,該方法具有很好的精度與靈活性,已成為求解各種電磁場問題的有力工具。半導體技術的快速髮展使得 CPU 的計算性能有瞭飛躍性的進步,但是直到現在 FDTD 法的在CPU 上的計算時間依舊非常耗時,這極大地限製瞭 FDTD 法在各種工程領域裏的應用。論文主要在 GPU 上實現和優化FDTD 算法,從而提高 FDTD 方法的計算效率,節省倣真時間。實驗結果錶明相對 Intel Xeon 處理器上執行的串行程序, GPU 最高可穫得166倍的加速。同時根據 Roofline 模型,GPU 性能達到理論值的89%。
FD T D산법시전자장영역사용비상엄범적수치계산방법,해방법구유흔호적정도여령활성,이성위구해각충전자장문제적유력공구。반도체기술적쾌속발전사득 CPU 적계산성능유료비약성적진보,단시직도현재 FDTD 법적재CPU 상적계산시간의구비상모시,저겁대지한제료 FDTD 법재각충공정영역리적응용。논문주요재 GPU 상실현화우화FDTD 산법,종이제고 FDTD 방법적계산효솔,절성방진시간。실험결과표명상대 Intel Xeon 처리기상집행적천행정서, GPU 최고가획득166배적가속。동시근거 Roofline 모형,GPU 성능체도이론치적89%。
FDTD algorithm is a very extensive numerical method for the electromagnetic field ,which has good accuracy and flexibility ,and has become a powerful tool for solving various electromagnetic problems .The rapid development of semi‐conductor technology makes the computational performance of the CPU has made progress in leaps and bounds ,but until now on the CPU computing time of FDTD method is still very time consuming ,which greatly limits the FDTD method in various engineering fields of applications .The FDTD algorithm on the GPU is realized and optimized ,so as to improve the calcula‐tion efficiency of the FDTD method ,save the simulation time .Experimental results show that the serial program is executed on the relative Xeon Intel processor ,and the maximum of GPU can get 166 times speedup .According to the roofline model , the performance of the GPU reaches 89% of the theoretical value .