计算机科学
計算機科學
계산궤과학
COMPUTER SCIENCE
2013年
3期
79-85,110
,共8页
庞旭%张云泉%龙国平%贾海鹏%颜深根
龐旭%張雲泉%龍國平%賈海鵬%顏深根
방욱%장운천%룡국평%가해붕%안심근
GPU%APU%OpenCL%均值平移算法
GPU%APU%OpenCL%均值平移算法
GPU%APU%OpenCL%균치평이산법
OpenCL作为一种面向多种平台、通用目的的编程标准,已经对许多应用程序进行了加速.由于平台硬件和软件环境的差异,通用的优化方法不一定在所有平台都有很好的加速.通过对均值平移算法在GPU和APU平台的优化,探讨了不同平台各种优化方法的贡献力,一方面研究各个平台的计算特性,另一方面体会不同优化方法的优劣,在优劣的相互转化中寻求最优的解决方案.实验表明,算法并行优化前、后在AMD 5850、Tesla C2050和APU A63650上分别达到了9.68、5.74和1.27倍加速,并行相比串行程序达到79.73、93.88和2.22倍加速,前两个平台OpenCL版本相比,CUDA版本的OpenCV程序达到1.27和1.24倍加速.
OpenCL作為一種麵嚮多種平檯、通用目的的編程標準,已經對許多應用程序進行瞭加速.由于平檯硬件和軟件環境的差異,通用的優化方法不一定在所有平檯都有很好的加速.通過對均值平移算法在GPU和APU平檯的優化,探討瞭不同平檯各種優化方法的貢獻力,一方麵研究各箇平檯的計算特性,另一方麵體會不同優化方法的優劣,在優劣的相互轉化中尋求最優的解決方案.實驗錶明,算法併行優化前、後在AMD 5850、Tesla C2050和APU A63650上分彆達到瞭9.68、5.74和1.27倍加速,併行相比串行程序達到79.73、93.88和2.22倍加速,前兩箇平檯OpenCL版本相比,CUDA版本的OpenCV程序達到1.27和1.24倍加速.
OpenCL작위일충면향다충평태、통용목적적편정표준,이경대허다응용정서진행료가속.유우평태경건화연건배경적차이,통용적우화방법불일정재소유평태도유흔호적가속.통과대균치평이산법재GPU화APU평태적우화,탐토료불동평태각충우화방법적공헌력,일방면연구각개평태적계산특성,령일방면체회불동우화방법적우렬,재우렬적상호전화중심구최우적해결방안.실험표명,산법병행우화전、후재AMD 5850、Tesla C2050화APU A63650상분별체도료9.68、5.74화1.27배가속,병행상비천행정서체도79.73、93.88화2.22배가속,전량개평태OpenCL판본상비,CUDA판본적OpenCV정서체도1.27화1.24배가속.