计算机科学
計算機科學
계산궤과학
Computer Science
2015年
11期
56-58,62
,共4页
集成众核%卸载模式%并行%多线程%有限元
集成衆覈%卸載模式%併行%多線程%有限元
집성음핵%사재모식%병행%다선정%유한원
Many integrated core%Offload mode%Parallel%Multi-threads%Finite element
基于英特尔集成众核(Many Integrated Core,MIC)架构,将有限元网格积分算法在至强融核(Xeon Phi)协处理器做了移植和性能分析.该应用全面测试了有限元分析的核心计算过程在MIC上的加速效果,实现了卸载模式(off load)[1]下利用OpenMP在MIC上的线程并行化.计算性能测试结果显示集成众核平台可以有效地加速有限元网格积分算法:1)一块被充分利用的MIC设备卡(3115A)的计算能力超过两路16核Intel XeonTM E5-2670 CPU;2)MIC并发的物理线程可能由于公共缓存访问存在竞争而降低程序的扩展性.测试结果还显示了在多CPU多MIC平台上进一步移植完整的MPI并行有限元模拟软件的可行性.这项工作有助于推动与有限元网格相关的科学和工程高性能计算的研究.
基于英特爾集成衆覈(Many Integrated Core,MIC)架構,將有限元網格積分算法在至彊融覈(Xeon Phi)協處理器做瞭移植和性能分析.該應用全麵測試瞭有限元分析的覈心計算過程在MIC上的加速效果,實現瞭卸載模式(off load)[1]下利用OpenMP在MIC上的線程併行化.計算性能測試結果顯示集成衆覈平檯可以有效地加速有限元網格積分算法:1)一塊被充分利用的MIC設備卡(3115A)的計算能力超過兩路16覈Intel XeonTM E5-2670 CPU;2)MIC併髮的物理線程可能由于公共緩存訪問存在競爭而降低程序的擴展性.測試結果還顯示瞭在多CPU多MIC平檯上進一步移植完整的MPI併行有限元模擬軟件的可行性.這項工作有助于推動與有限元網格相關的科學和工程高性能計算的研究.
기우영특이집성음핵(Many Integrated Core,MIC)가구,장유한원망격적분산법재지강융핵(Xeon Phi)협처리기주료이식화성능분석.해응용전면측시료유한원분석적핵심계산과정재MIC상적가속효과,실현료사재모식(off load)[1]하이용OpenMP재MIC상적선정병행화.계산성능측시결과현시집성음핵평태가이유효지가속유한원망격적분산법:1)일괴피충분이용적MIC설비잡(3115A)적계산능력초과량로16핵Intel XeonTM E5-2670 CPU;2)MIC병발적물리선정가능유우공공완존방문존재경쟁이강저정서적확전성.측시결과환현시료재다CPU다MIC평태상진일보이식완정적MPI병행유한원모의연건적가행성.저항공작유조우추동여유한원망격상관적과학화공정고성능계산적연구.