计算机研究与发展
計算機研究與髮展
계산궤연구여발전
JOURNAL OF COMPUTER RESEARCH AND DEVELOPMENT
2013年
7期
1491-1500
,共10页
唐亮%骆祖莹%赵国兴%杨旭
唐亮%駱祖瑩%趙國興%楊旭
당량%락조형%조국흥%양욱
图形处理器%连续过松弛算法%统一计算设备架构%并行算法%电源线/地线网络(P/G网)
圖形處理器%連續過鬆弛算法%統一計算設備架構%併行算法%電源線/地線網絡(P/G網)
도형처리기%련속과송이산법%통일계산설비가구%병행산법%전원선/지선망락(P/G망)
graphic processing unit (GPU)%successive over-relaxation (SOR) algorithm%compute unified device architecture (CUDA)%parallel computing%power/ground network
近年来电子设计自动化(EDA)研究人员尝试利用图形处理器(graphic processing unit,GPU)提供的高性能计算能力对IC参数分析进行加速研究.为了利用GPU进行电源线/地线网络(power/ground network,P/G网)快速分析,设计了一种基于经典的连续过松弛(successive over-relaxation,SOR)算法的高效P/G网分析并行算法.基于GPU并行计算加速原理,此算法进行了如下改进:1)采用红-黑次序的松弛策略.将所有的节点分为红黑两类,红色节点的所有邻点只有黑色节点、黑色节点的所有邻点只有红色节点,红色节点与黑色节点交替松弛,保证了GPU并行计算中的数据一致性.对于具有N个节点的P/G网而言,一次红色节点或黑色节点松弛可以同时对N/2个节点进行松弛操作,即理论上可以同时启动N/2个并行线程.2)优化数据结构.实现了对数据空间的合并访问,以保证对GPU全局存储空间的最优访问.3)在共享存储器内通过并行归约对松弛标记进行快速统计,同时利用zero-copy技术进行松弛标记的快速拷贝,以快速决定是否继续松弛.大量的实验结果表明:与单线程的CPU程序相比,此算法的加速倍数随GPU所提供物理线程的数目增加而线性增加,可以获得最大242倍的加速效果,是目前EDA研究领域中加速效果最好的GPU算法.
近年來電子設計自動化(EDA)研究人員嘗試利用圖形處理器(graphic processing unit,GPU)提供的高性能計算能力對IC參數分析進行加速研究.為瞭利用GPU進行電源線/地線網絡(power/ground network,P/G網)快速分析,設計瞭一種基于經典的連續過鬆弛(successive over-relaxation,SOR)算法的高效P/G網分析併行算法.基于GPU併行計算加速原理,此算法進行瞭如下改進:1)採用紅-黑次序的鬆弛策略.將所有的節點分為紅黑兩類,紅色節點的所有鄰點隻有黑色節點、黑色節點的所有鄰點隻有紅色節點,紅色節點與黑色節點交替鬆弛,保證瞭GPU併行計算中的數據一緻性.對于具有N箇節點的P/G網而言,一次紅色節點或黑色節點鬆弛可以同時對N/2箇節點進行鬆弛操作,即理論上可以同時啟動N/2箇併行線程.2)優化數據結構.實現瞭對數據空間的閤併訪問,以保證對GPU全跼存儲空間的最優訪問.3)在共享存儲器內通過併行歸約對鬆弛標記進行快速統計,同時利用zero-copy技術進行鬆弛標記的快速拷貝,以快速決定是否繼續鬆弛.大量的實驗結果錶明:與單線程的CPU程序相比,此算法的加速倍數隨GPU所提供物理線程的數目增加而線性增加,可以穫得最大242倍的加速效果,是目前EDA研究領域中加速效果最好的GPU算法.
근년래전자설계자동화(EDA)연구인원상시이용도형처리기(graphic processing unit,GPU)제공적고성능계산능력대IC삼수분석진행가속연구.위료이용GPU진행전원선/지선망락(power/ground network,P/G망)쾌속분석,설계료일충기우경전적련속과송이(successive over-relaxation,SOR)산법적고효P/G망분석병행산법.기우GPU병행계산가속원리,차산법진행료여하개진:1)채용홍-흑차서적송이책략.장소유적절점분위홍흑량류,홍색절점적소유린점지유흑색절점、흑색절점적소유린점지유홍색절점,홍색절점여흑색절점교체송이,보증료GPU병행계산중적수거일치성.대우구유N개절점적P/G망이언,일차홍색절점혹흑색절점송이가이동시대N/2개절점진행송이조작,즉이론상가이동시계동N/2개병행선정.2)우화수거결구.실현료대수거공간적합병방문,이보증대GPU전국존저공간적최우방문.3)재공향존저기내통과병행귀약대송이표기진행쾌속통계,동시이용zero-copy기술진행송이표기적쾌속고패,이쾌속결정시부계속송이.대량적실험결과표명:여단선정적CPU정서상비,차산법적가속배수수GPU소제공물리선정적수목증가이선성증가,가이획득최대242배적가속효과,시목전EDA연구영역중가속효과최호적GPU산법.