计算机学报
計算機學報
계산궤학보
CHINESE JOURNAL OF COMPUTERS
2012年
1期
112-122
,共11页
四精度浮点算术%LU分解%MGS-QR分解%FPGA%硬件加速器%E量级计算
四精度浮點算術%LU分解%MGS-QR分解%FPGA%硬件加速器%E量級計算
사정도부점산술%LU분해%MGS-QR분해%FPGA%경건가속기%E량급계산
探索了 FPGA平台加速高精度科学计算应用的能力和灵活性.首先,研究科学计算中最常用的操作——向量内积,提出基于定点操作的精确向量内积算法.以IEEE 754-2008标准的四精度(Quadruple Precision)浮点算术为例,在FPGA平台上设计了一个基于全展开方法的全流水四精度浮点乘累加单元(QPMAC):提出两级存储策略精确存储乘累加和;采用保留进位累加策略减少定点加法器位宽、简化进位处理、优化关键路径;引入累加和划分策略,实现流水吞吐率.最后,在XC5VLX330 FPGA芯片上设计一个LU分解和MGS-QR分解加速器原型来验证QPMAC的性能.实验结果表明,与运行在Intel四核处理器上的基于OpenMP的并行算法相比,集成4个QP-MAC单元的加速器能获得42倍到97倍的性能提升,并且能获得更高结果精度和更低能量消耗.
探索瞭 FPGA平檯加速高精度科學計算應用的能力和靈活性.首先,研究科學計算中最常用的操作——嚮量內積,提齣基于定點操作的精確嚮量內積算法.以IEEE 754-2008標準的四精度(Quadruple Precision)浮點算術為例,在FPGA平檯上設計瞭一箇基于全展開方法的全流水四精度浮點乘纍加單元(QPMAC):提齣兩級存儲策略精確存儲乘纍加和;採用保留進位纍加策略減少定點加法器位寬、簡化進位處理、優化關鍵路徑;引入纍加和劃分策略,實現流水吞吐率.最後,在XC5VLX330 FPGA芯片上設計一箇LU分解和MGS-QR分解加速器原型來驗證QPMAC的性能.實驗結果錶明,與運行在Intel四覈處理器上的基于OpenMP的併行算法相比,集成4箇QP-MAC單元的加速器能穫得42倍到97倍的性能提升,併且能穫得更高結果精度和更低能量消耗.
탐색료 FPGA평태가속고정도과학계산응용적능력화령활성.수선,연구과학계산중최상용적조작——향량내적,제출기우정점조작적정학향량내적산법.이IEEE 754-2008표준적사정도(Quadruple Precision)부점산술위례,재FPGA평태상설계료일개기우전전개방법적전류수사정도부점승루가단원(QPMAC):제출량급존저책략정학존저승루가화;채용보류진위루가책략감소정점가법기위관、간화진위처리、우화관건로경;인입루가화화분책략,실현류수탄토솔.최후,재XC5VLX330 FPGA심편상설계일개LU분해화MGS-QR분해가속기원형래험증QPMAC적성능.실험결과표명,여운행재Intel사핵처리기상적기우OpenMP적병행산법상비,집성4개QP-MAC단원적가속기능획득42배도97배적성능제승,병차능획득경고결과정도화경저능량소모.