小型微型计算机系统
小型微型計算機繫統
소형미형계산궤계통
MINI-MICRO SYSTEMS
2012年
3期
594-597
,共4页
龙芯3A%FFT%性能优化%KD-60
龍芯3A%FFT%性能優化%KD-60
룡심3A%FFT%성능우화%KD-60
FFT(Fast Fourier transform,快速傅立叶变换)是工程应用中的一个基本算法,优化其性能对于推广龙芯系列处理器的应用具有重要意义.本文充分挖掘龙芯3A处理器的硬件特性,对运算量和调整位序的过程作了优化并使用128位访存来减少访存指令的比例,从而实现了高效的FFT算法.实验结果表明,在825M龙芯3A处理器上经过优化后的一维FFT的速度是FF-TW库的2.5倍左右,而二维FFT的速度则是FFTW的3倍左右.
FFT(Fast Fourier transform,快速傅立葉變換)是工程應用中的一箇基本算法,優化其性能對于推廣龍芯繫列處理器的應用具有重要意義.本文充分挖掘龍芯3A處理器的硬件特性,對運算量和調整位序的過程作瞭優化併使用128位訪存來減少訪存指令的比例,從而實現瞭高效的FFT算法.實驗結果錶明,在825M龍芯3A處理器上經過優化後的一維FFT的速度是FF-TW庫的2.5倍左右,而二維FFT的速度則是FFTW的3倍左右.
FFT(Fast Fourier transform,쾌속부립협변환)시공정응용중적일개기본산법,우화기성능대우추엄룡심계렬처리기적응용구유중요의의.본문충분알굴룡심3A처리기적경건특성,대운산량화조정위서적과정작료우화병사용128위방존래감소방존지령적비례,종이실현료고효적FFT산법.실험결과표명,재825M룡심3A처리기상경과우화후적일유FFT적속도시FF-TW고적2.5배좌우,이이유FFT적속도칙시FFTW적3배좌우.