计算机辅助设计与图形学学报
計算機輔助設計與圖形學學報
계산궤보조설계여도형학학보
JOURNAL OF COMPUTER-AIDED DESIGN & COMPUTER GRAPHICS
2010年
11期
1932-1939
,共8页
吴亮%钟诚文%郑彦奎%刘沙%卓丛山%陈效鹏
吳亮%鐘誠文%鄭彥奎%劉沙%卓叢山%陳效鵬
오량%종성문%정언규%류사%탁총산%진효붕
CUDA%多线程技术%Lattice Boltzmann方法%多图形处理器%信号量%并行计算
CUDA%多線程技術%Lattice Boltzmann方法%多圖形處理器%信號量%併行計算
CUDA%다선정기술%Lattice Boltzmann방법%다도형처리기%신호량%병행계산
为了提高计算流体领域中复杂流动现象模拟计算的高效性和准确性,充分利用图形硬件的并行性,提出一种在单机多图形处理器下基于CUDA架构的Lattice Boltzmann方法(LBM)的模拟算法.采用区域划分策略将域上的LBM网格平均分配到不同的GPU设备上,在分区边界处搭接一层网格以方便计算该处网格的迁移过程,减少GPU间的通信量,并合理地利用CUDA存储层次架构中的全局内存和纹理内存为计算网格分配设备空间;采用多线程技术,用每个线程控制不同的GPU设备,同时引入线程同步机制信号量实现线程间的数据通信同步控制,按照LBM方程组的求解过程实现模拟计算.实验结果表明,双GPU将计算加速到单GPU的1.77倍左右,同时将流场计算网格规模从单GPU下的4160×4160扩大到双GPU下的6144×6144.
為瞭提高計算流體領域中複雜流動現象模擬計算的高效性和準確性,充分利用圖形硬件的併行性,提齣一種在單機多圖形處理器下基于CUDA架構的Lattice Boltzmann方法(LBM)的模擬算法.採用區域劃分策略將域上的LBM網格平均分配到不同的GPU設備上,在分區邊界處搭接一層網格以方便計算該處網格的遷移過程,減少GPU間的通信量,併閤理地利用CUDA存儲層次架構中的全跼內存和紋理內存為計算網格分配設備空間;採用多線程技術,用每箇線程控製不同的GPU設備,同時引入線程同步機製信號量實現線程間的數據通信同步控製,按照LBM方程組的求解過程實現模擬計算.實驗結果錶明,雙GPU將計算加速到單GPU的1.77倍左右,同時將流場計算網格規模從單GPU下的4160×4160擴大到雙GPU下的6144×6144.
위료제고계산류체영역중복잡류동현상모의계산적고효성화준학성,충분이용도형경건적병행성,제출일충재단궤다도형처리기하기우CUDA가구적Lattice Boltzmann방법(LBM)적모의산법.채용구역화분책략장역상적LBM망격평균분배도불동적GPU설비상,재분구변계처탑접일층망격이방편계산해처망격적천이과정,감소GPU간적통신량,병합리지이용CUDA존저층차가구중적전국내존화문리내존위계산망격분배설비공간;채용다선정기술,용매개선정공제불동적GPU설비,동시인입선정동보궤제신호량실현선정간적수거통신동보공제,안조LBM방정조적구해과정실현모의계산.실험결과표명,쌍GPU장계산가속도단GPU적1.77배좌우,동시장류장계산망격규모종단GPU하적4160×4160확대도쌍GPU하적6144×6144.