自动化与仪器仪表
自動化與儀器儀錶
자동화여의기의표
AUTOMATION & INSTRUMENTATION
2014年
12期
25-28
,共4页
FFT%GPU%CUDA
FFT%GPU%CUDA
FFT%GPU%CUDA
FFT%GPU%CUDA
FFT(快速傅里叶变换)是基于提高DFT(离散傅里叶变换)计算的高效算法,它在众多科学和工程领域都得到了广泛的应用.自FFT算法出现以后,从早期的以降低复杂度到近年以来的大规模并行FFT计算,各种优化算法得到广泛的研究.在并行运算领域中,随着可编程的、并行化GPU的不断推广,特别是通用并行统一计算架构CUDA的出现,极大增强了GPU的计算能力,在编程和优化等方面都有显著地提升.鉴于此,本文在分析FFT算法实现的基础上,研究了一种适合GPU运算的FFT并行计算方法,并通过CUDA架构实现了FFT算法在GPU上的运算.该方法的引入在理论不计算数据传输的情况下,使一维FFT运算时间的复杂度由O(Nlog2)可以降到O(Nlog2).通过验证,本文提出的CUDA的并行FFT方法得到较好的加速效果,在精度计算上也符合实际的要求,从而证明了该方法的正确性和有效性.
FFT(快速傅裏葉變換)是基于提高DFT(離散傅裏葉變換)計算的高效算法,它在衆多科學和工程領域都得到瞭廣汎的應用.自FFT算法齣現以後,從早期的以降低複雜度到近年以來的大規模併行FFT計算,各種優化算法得到廣汎的研究.在併行運算領域中,隨著可編程的、併行化GPU的不斷推廣,特彆是通用併行統一計算架構CUDA的齣現,極大增彊瞭GPU的計算能力,在編程和優化等方麵都有顯著地提升.鑒于此,本文在分析FFT算法實現的基礎上,研究瞭一種適閤GPU運算的FFT併行計算方法,併通過CUDA架構實現瞭FFT算法在GPU上的運算.該方法的引入在理論不計算數據傳輸的情況下,使一維FFT運算時間的複雜度由O(Nlog2)可以降到O(Nlog2).通過驗證,本文提齣的CUDA的併行FFT方法得到較好的加速效果,在精度計算上也符閤實際的要求,從而證明瞭該方法的正確性和有效性.
FFT(쾌속부리협변환)시기우제고DFT(리산부리협변환)계산적고효산법,타재음다과학화공정영역도득도료엄범적응용.자FFT산법출현이후,종조기적이강저복잡도도근년이래적대규모병행FFT계산,각충우화산법득도엄범적연구.재병행운산영역중,수착가편정적、병행화GPU적불단추엄,특별시통용병행통일계산가구CUDA적출현,겁대증강료GPU적계산능력,재편정화우화등방면도유현저지제승.감우차,본문재분석FFT산법실현적기출상,연구료일충괄합GPU운산적FFT병행계산방법,병통과CUDA가구실현료FFT산법재GPU상적운산.해방법적인입재이론불계산수거전수적정황하,사일유FFT운산시간적복잡도유O(Nlog2)가이강도O(Nlog2).통과험증,본문제출적CUDA적병행FFT방법득도교호적가속효과,재정도계산상야부합실제적요구,종이증명료해방법적정학성화유효성.