计算机科学
計算機科學
계산궤과학
COMPUTER SCIENCE
2012年
3期
260-264
,共5页
AMD GPU%Blur%OpenCL%图像对象
AMD GPU%Blur%OpenCL%圖像對象
AMD GPU%Blur%OpenCL%도상대상
现代GPU一般都提供特定硬件(如纹理部件、光栅化部件及各种片上缓存)以加速二维图像的处理和显示过程,相应的编程模型(CUDA、OpenCL)都定义了特定程序设计接口(CUDA的纹理内存,OpenCL的图像对象)以便图像应用能利用相关硬件支持.以典型图像模糊化处理算法在AMD平台GPU的优化为例,探讨了OpenCL的图像对象在图像算法优化上的适用范围,尤其是分析了其相对于更通用的基于全局内存加片上局部存储进行性能优化的方法的优劣.实验结果表明,图像对象只有在图像为四通道且计算过程中需要缓存的数据量较小时才能带来较好的性能改善,其余情况采用全局内存加局部存储都能获得较好性能.优化后的算法性能相对于精心实现的CPU版加速比为200~1000;相对于NVIDIA NPP库相应函数的性能加速比为1.3~5.
現代GPU一般都提供特定硬件(如紋理部件、光柵化部件及各種片上緩存)以加速二維圖像的處理和顯示過程,相應的編程模型(CUDA、OpenCL)都定義瞭特定程序設計接口(CUDA的紋理內存,OpenCL的圖像對象)以便圖像應用能利用相關硬件支持.以典型圖像模糊化處理算法在AMD平檯GPU的優化為例,探討瞭OpenCL的圖像對象在圖像算法優化上的適用範圍,尤其是分析瞭其相對于更通用的基于全跼內存加片上跼部存儲進行性能優化的方法的優劣.實驗結果錶明,圖像對象隻有在圖像為四通道且計算過程中需要緩存的數據量較小時纔能帶來較好的性能改善,其餘情況採用全跼內存加跼部存儲都能穫得較好性能.優化後的算法性能相對于精心實現的CPU版加速比為200~1000;相對于NVIDIA NPP庫相應函數的性能加速比為1.3~5.
현대GPU일반도제공특정경건(여문리부건、광책화부건급각충편상완존)이가속이유도상적처리화현시과정,상응적편정모형(CUDA、OpenCL)도정의료특정정서설계접구(CUDA적문리내존,OpenCL적도상대상)이편도상응용능이용상관경건지지.이전형도상모호화처리산법재AMD평태GPU적우화위례,탐토료OpenCL적도상대상재도상산법우화상적괄용범위,우기시분석료기상대우경통용적기우전국내존가편상국부존저진행성능우화적방법적우렬.실험결과표명,도상대상지유재도상위사통도차계산과정중수요완존적수거량교소시재능대래교호적성능개선,기여정황채용전국내존가국부존저도능획득교호성능.우화후적산법성능상대우정심실현적CPU판가속비위200~1000;상대우NVIDIA NPP고상응함수적성능가속비위1.3~5.