CAJ | 학술논문

探索了 FPGA平台加速高精度科学计算应用的能力和灵活性.首先,研究科学计算中最常用的操作——向量内积,提出基于定点操作的精确向量内积算法.以IEEE 754-2008标准的四精度(Quadruple Precision)浮点算术为例,在FPGA平台上设计了一个基于全展开方法的全流水四精度浮点乘累加单元(QPMAC):提出两级存储策略精确存储乘累加和；采用保留进位累加策略减少定点加法器位宽、简化进位处理、优化关键路径；引入累加和划分策略,实现流水吞吐率.最后,在XC5VLX330 FPGA芯片上设计一个LU分解和MGS-QR分解加速器原型来验证QPMAC的性能.实验结果表明,与运行在Intel四核处理器上的基于OpenMP的并行算法相比,集成4个QP-MAC单元的加速器能获得42倍到97倍的性能提升,并且能获得更高结果精度和更低能量消耗.
탐색료 FPGA평태가속고정도과학계산응용적능력화령활성.수선,연구과학계산중최상용적조작——향량내적,제출기우정점조작적정학향량내적산법.이IEEE 754-2008표준적사정도(Quadruple Precision)부점산술위례,재FPGA평태상설계료일개기우전전개방법적전류수사정도부점승루가단원(QPMAC):제출량급존저책략정학존저승루가화；채용보류진위루가책략감소정점가법기위관、간화진위처리、우화관건로경；인입루가화화분책략,실현류수탄토솔.최후,재XC5VLX330 FPGA심편상설계일개LU분해화MGS-QR분해가속기원형래험증QPMAC적성능.실험결과표명,여운행재Intel사핵처리기상적기우OpenMP적병행산법상비,집성4개QP-MAC단원적가속기능획득42배도97배적성능제승,병차능획득경고결과정도화경저능량소모.