高技术通讯
高技術通訊
고기술통신
Chinese High Technology Letters
2015年
4期
357-364
,共8页
张爽爽%孟小甫%汪文祥%高翔
張爽爽%孟小甫%汪文祥%高翔
장상상%맹소보%왕문상%고상
处理器核%UA%图形%图像
處理器覈%UA%圖形%圖像
처리기핵%UA%도형%도상
CPU core%uncache acceleration%graphics%video
针对当前采用独立显卡的桌面计算机系统架构普遍存在的CPU(中心处理单元)访问GPU(图形处理单元)存储空间数据传输延迟较大的瓶颈,采用了龙芯GS464处理器核心实现的UA(uncache acceleration)机制对GPU驱动程序中的GPU存储空间访问接口进行优化,极大地提高了处理器向GPU等IO存储空间连续数据写入的速度.详细分析了龙芯处理器UA机制的原理及其相对于uncache方式IO写所能带来的性能提升.通过UA机制优化了龙芯3A+ 2H平台的GPU驱动性能,x11peff测试结果显示,采用UA优化GPU驱动后,Xserver的一些接口性能提升达5% ~230%.将龙芯处理器的UA机制封装到了标准MMAP系统调用,并通过该扩展后的系统调用优化了Xserver的Xvideo扩展接口,实验结果显示,播放常见较高分辨率视频时该接口性能能够有6 ~12倍的性能提升.
針對噹前採用獨立顯卡的桌麵計算機繫統架構普遍存在的CPU(中心處理單元)訪問GPU(圖形處理單元)存儲空間數據傳輸延遲較大的瓶頸,採用瞭龍芯GS464處理器覈心實現的UA(uncache acceleration)機製對GPU驅動程序中的GPU存儲空間訪問接口進行優化,極大地提高瞭處理器嚮GPU等IO存儲空間連續數據寫入的速度.詳細分析瞭龍芯處理器UA機製的原理及其相對于uncache方式IO寫所能帶來的性能提升.通過UA機製優化瞭龍芯3A+ 2H平檯的GPU驅動性能,x11peff測試結果顯示,採用UA優化GPU驅動後,Xserver的一些接口性能提升達5% ~230%.將龍芯處理器的UA機製封裝到瞭標準MMAP繫統調用,併通過該擴展後的繫統調用優化瞭Xserver的Xvideo擴展接口,實驗結果顯示,播放常見較高分辨率視頻時該接口性能能夠有6 ~12倍的性能提升.
침대당전채용독립현잡적탁면계산궤계통가구보편존재적CPU(중심처리단원)방문GPU(도형처리단원)존저공간수거전수연지교대적병경,채용료룡심GS464처리기핵심실현적UA(uncache acceleration)궤제대GPU구동정서중적GPU존저공간방문접구진행우화,겁대지제고료처리기향GPU등IO존저공간련속수거사입적속도.상세분석료룡심처리기UA궤제적원리급기상대우uncache방식IO사소능대래적성능제승.통과UA궤제우화료룡심3A+ 2H평태적GPU구동성능,x11peff측시결과현시,채용UA우화GPU구동후,Xserver적일사접구성능제승체5% ~230%.장룡심처리기적UA궤제봉장도료표준MMAP계통조용,병통과해확전후적계통조용우화료Xserver적Xvideo확전접구,실험결과현시,파방상견교고분변솔시빈시해접구성능능구유6 ~12배적성능제승.