科技传播
科技傳播
과기전파
PUBLIC COMMUNICATION OF SCIENCE & TECHNOLOGY
2011年
21期
189
,共1页
矩阵%乘法%GPU
矩陣%乘法%GPU
구진%승법%GPU
使用图形硬件来进行通用数值计算已经成为一个主流的讨论话题.以利用少量重用输入数据进行高度并行计算为代表的流算法的实现,已经广泛应用在GPU领域.其中密度矩阵乘法频繁的数据执行模式和高度并行计算的特点,使得矩阵乘法成为GPU高效计算的很好的一个选择.但令人惊讶的是,如此接近完美的GPU算法执行起来效率却不如目前采用的CPU缓存已知方式.我们发现导致这个现象的原因是在计算邻近的高速缓存时,GPU效率大大落后CPU,高速缓存带宽的限制降低了GPU执行计算重要重用数据的性能.
使用圖形硬件來進行通用數值計算已經成為一箇主流的討論話題.以利用少量重用輸入數據進行高度併行計算為代錶的流算法的實現,已經廣汎應用在GPU領域.其中密度矩陣乘法頻繁的數據執行模式和高度併行計算的特點,使得矩陣乘法成為GPU高效計算的很好的一箇選擇.但令人驚訝的是,如此接近完美的GPU算法執行起來效率卻不如目前採用的CPU緩存已知方式.我們髮現導緻這箇現象的原因是在計算鄰近的高速緩存時,GPU效率大大落後CPU,高速緩存帶寬的限製降低瞭GPU執行計算重要重用數據的性能.
사용도형경건래진행통용수치계산이경성위일개주류적토론화제.이이용소량중용수입수거진행고도병행계산위대표적류산법적실현,이경엄범응용재GPU영역.기중밀도구진승법빈번적수거집행모식화고도병행계산적특점,사득구진승법성위GPU고효계산적흔호적일개선택.단령인량아적시,여차접근완미적GPU산법집행기래효솔각불여목전채용적CPU완존이지방식.아문발현도치저개현상적원인시재계산린근적고속완존시,GPU효솔대대락후CPU,고속완존대관적한제강저료GPU집행계산중요중용수거적성능.