电子技术
電子技術
전자기술
ELECTRONIC TECHNOLOGY
2011年
12期
1-3
,共3页
基础线性代数程序集%ZGEMM%任务划分%多线程
基礎線性代數程序集%ZGEMM%任務劃分%多線程
기출선성대수정서집%ZGEMM%임무화분%다선정
BLAS库分为两类函数运算:复数函数与实数函数.矩阵乘法函数是BLAS库的核心函数,BLAS库中的许多函数在实现时都调用了矩阵乘法函数.文章结合龙芯3A体系结构的特点,通过对矩阵乘法计算过程的分析选择了先对矩阵分块然后进行任务划分的方式,从而减少了数据拷贝数量,提高了拷贝数据的利用率,并运用循环展开、指令调度、数据分块等技术对子线程的运算进行了优化.优化后的ZGEMM函数的多线程运算速度是ATLAS库的两倍.
BLAS庫分為兩類函數運算:複數函數與實數函數.矩陣乘法函數是BLAS庫的覈心函數,BLAS庫中的許多函數在實現時都調用瞭矩陣乘法函數.文章結閤龍芯3A體繫結構的特點,通過對矩陣乘法計算過程的分析選擇瞭先對矩陣分塊然後進行任務劃分的方式,從而減少瞭數據拷貝數量,提高瞭拷貝數據的利用率,併運用循環展開、指令調度、數據分塊等技術對子線程的運算進行瞭優化.優化後的ZGEMM函數的多線程運算速度是ATLAS庫的兩倍.
BLAS고분위량류함수운산:복수함수여실수함수.구진승법함수시BLAS고적핵심함수,BLAS고중적허다함수재실현시도조용료구진승법함수.문장결합룡심3A체계결구적특점,통과대구진승법계산과정적분석선택료선대구진분괴연후진행임무화분적방식,종이감소료수거고패수량,제고료고패수거적이용솔,병운용순배전개、지령조도、수거분괴등기술대자선정적운산진행료우화.우화후적ZGEMM함수적다선정운산속도시ATLAS고적량배.