西安交通大学学报
西安交通大學學報
서안교통대학학보
JOURNAL OF XI'AN JIAOTONG UNIVERSITY
2013年
10期
44-50
,共7页
李亮%王恩东%朱正东%颜康%张保%董小社
李亮%王恩東%硃正東%顏康%張保%董小社
리량%왕은동%주정동%안강%장보%동소사
GPU显存%动态生成树%数据复用%数据传输
GPU顯存%動態生成樹%數據複用%數據傳輸
GPU현존%동태생성수%수거복용%수거전수
GPU memory%dynamic spanning tree%data reuse%data transfer
针对手工优化GPU(Graphic Processing Unit)显存级数据复用过程复杂和编译时优化数据复用开销过大的问题,提出了一种基于动态生成树在运行时进行数据复用的优化方法,可为程序员提供一种透明且高效简单的优化方式.该方法将已经执行的GPU计算任务的数据访问抽象为生成树的叶子节点,利用动态生成树管理GPU数据访问信息,实现了运行时GPU显存级数据的复用优化,并通过运行时对生成树的搜索和维护,动态地发掘和优化GPU显存级数据复用,因此,在编程时不需要进行复杂且困难的数据复用分析,直接调用文中提出的运行时库就能有效减少程序执行过程中CPU内存和GPU显存之间的冗余数据传输次数,从而提升应用的运行性能.实验结果表明,使用文中提出的优化方法可有效消除未进行数据复用优化的CPU-GPU应用程序中的冗余数据传输,最大加速比达原始执行的3~10倍,额外开销不到优化后程序总执行时间的5%.
針對手工優化GPU(Graphic Processing Unit)顯存級數據複用過程複雜和編譯時優化數據複用開銷過大的問題,提齣瞭一種基于動態生成樹在運行時進行數據複用的優化方法,可為程序員提供一種透明且高效簡單的優化方式.該方法將已經執行的GPU計算任務的數據訪問抽象為生成樹的葉子節點,利用動態生成樹管理GPU數據訪問信息,實現瞭運行時GPU顯存級數據的複用優化,併通過運行時對生成樹的搜索和維護,動態地髮掘和優化GPU顯存級數據複用,因此,在編程時不需要進行複雜且睏難的數據複用分析,直接調用文中提齣的運行時庫就能有效減少程序執行過程中CPU內存和GPU顯存之間的冗餘數據傳輸次數,從而提升應用的運行性能.實驗結果錶明,使用文中提齣的優化方法可有效消除未進行數據複用優化的CPU-GPU應用程序中的冗餘數據傳輸,最大加速比達原始執行的3~10倍,額外開銷不到優化後程序總執行時間的5%.
침대수공우화GPU(Graphic Processing Unit)현존급수거복용과정복잡화편역시우화수거복용개소과대적문제,제출료일충기우동태생성수재운행시진행수거복용적우화방법,가위정서원제공일충투명차고효간단적우화방식.해방법장이경집행적GPU계산임무적수거방문추상위생성수적협자절점,이용동태생성수관리GPU수거방문신식,실현료운행시GPU현존급수거적복용우화,병통과운행시대생성수적수색화유호,동태지발굴화우화GPU현존급수거복용,인차,재편정시불수요진행복잡차곤난적수거복용분석,직접조용문중제출적운행시고취능유효감소정서집행과정중CPU내존화GPU현존지간적용여수거전수차수,종이제승응용적운행성능.실험결과표명,사용문중제출적우화방법가유효소제미진행수거복용우화적CPU-GPU응용정서중적용여수거전수,최대가속비체원시집행적3~10배,액외개소불도우화후정서총집행시간적5%.