新型工业化
新型工業化
신형공업화
New Industrialization Straregy
2012年
9期
43-52
,共10页
有限域%乘法%并行计算%图形处理器
有限域%乘法%併行計算%圖形處理器
유한역%승법%병행계산%도형처리기
Galois Field%multiplication%Parallel Computing%GPU
本论文介绍了GF(2m)域乘法运用CUDA编程语言在GPU(Graphic Processing Unit)上的并行加速的一般算法,并提出同样运用CUDA在GPU上实现的新型GF(2m)域乘法NPU-MUL并行算法,相较前者,该算法减少了大量对GPU全局存储器的原子操作。通过在NVIDIA公司的显示卡GeForce GTS 250上实现两种算法,表明NPU-MUL的运行时间是一般域乘法的运行时间的五分之一。
本論文介紹瞭GF(2m)域乘法運用CUDA編程語言在GPU(Graphic Processing Unit)上的併行加速的一般算法,併提齣同樣運用CUDA在GPU上實現的新型GF(2m)域乘法NPU-MUL併行算法,相較前者,該算法減少瞭大量對GPU全跼存儲器的原子操作。通過在NVIDIA公司的顯示卡GeForce GTS 250上實現兩種算法,錶明NPU-MUL的運行時間是一般域乘法的運行時間的五分之一。
본논문개소료GF(2m)역승법운용CUDA편정어언재GPU(Graphic Processing Unit)상적병행가속적일반산법,병제출동양운용CUDA재GPU상실현적신형GF(2m)역승법NPU-MUL병행산법,상교전자,해산법감소료대량대GPU전국존저기적원자조작。통과재NVIDIA공사적현시잡GeForce GTS 250상실현량충산법,표명NPU-MUL적운행시간시일반역승법적운행시간적오분지일。
This paper describes the general algorithm of multiplication for GF(2m) implemented using CUDA programming language for GPU(Graphic Processing Unit),and presents a new parallel algorithm called NPU-MUL.Comparing with the former,the new algorithm reduces a lot of atomic operations on global memory.The experimental result on GeForce GTS 250 shows that the running time of NPU-MUL is one fifth of the general one.