计算机工程与科学
計算機工程與科學
계산궤공정여과학
COMPUTER ENGINEERING & SCIENCE
2010年
9期
102-106,164
,共6页
Cholesky分解%细粒度并行%FPGA
Cholesky分解%細粒度併行%FPGA
Cholesky분해%세립도병행%FPGA
本文提出了一种Cholesky分解细粒度流水线并行算法,该算法可以处理任意规模的数据,可以充分开发FPGA加速器提供的细粒度并行.实验表明,该算法具有很好的可扩展性,在Xilinx XC5VLX330 FPGA上能够集成36个处理单元(PE),当矩阵的阶为16 384、运行频率为200MHz时性能达到14.3 GFLOPS.
本文提齣瞭一種Cholesky分解細粒度流水線併行算法,該算法可以處理任意規模的數據,可以充分開髮FPGA加速器提供的細粒度併行.實驗錶明,該算法具有很好的可擴展性,在Xilinx XC5VLX330 FPGA上能夠集成36箇處理單元(PE),噹矩陣的階為16 384、運行頻率為200MHz時性能達到14.3 GFLOPS.
본문제출료일충Cholesky분해세립도류수선병행산법,해산법가이처리임의규모적수거,가이충분개발FPGA가속기제공적세립도병행.실험표명,해산법구유흔호적가확전성,재Xilinx XC5VLX330 FPGA상능구집성36개처리단원(PE),당구진적계위16 384、운행빈솔위200MHz시성능체도14.3 GFLOPS.