浙江大学学报(工学版)
浙江大學學報(工學版)
절강대학학보(공학판)
JOURNAL OF ZHEJIANG UNIVERSITY (ENGINEERING SCIENCE)
2008年
4期
608-611,666
,共5页
李德贤%秦兴%严晓浪%彭剑英
李德賢%秦興%嚴曉浪%彭劍英
리덕현%진흥%엄효랑%팽검영
H.264/AVC%去块效应滤波%专用指令集处理器
H.264/AVC%去塊效應濾波%專用指令集處理器
H.264/AVC%거괴효응려파%전용지령집처리기
针对H.264/AVC环内去块效应滤波器算法中分支密集、分支判断条件产生复杂,以及可变阶数有限冲击响应(FIR)滤波算法复杂度高等性能瓶颈,基于专用指令集处理器(ASIP)Schubert平台提出了加法舍人移位指令和两级条件比较指令,并给出了其专用数据通路的设计实现.根据算法分支执行分布情况优化了算法中分支选择部分的实现,保证了代码的高并行度.时钟精确指令集仿真器的运行结果表明,完成强度为4的4×4像素块边界滤波需要140个时钟周期,而完成强度小于4的边界滤波需要100个时钟周期.运行1/4共享中间格式(QCIF)测试序列时,较x264中的Intel MMX指令实现性能有48%~63%的提升.实验结果表明,使用ASIP实现,可以显著提高去块效应滤波的性能;同时由于其可编程性,可以适应多个视频标准.
針對H.264/AVC環內去塊效應濾波器算法中分支密集、分支判斷條件產生複雜,以及可變階數有限遲擊響應(FIR)濾波算法複雜度高等性能瓶頸,基于專用指令集處理器(ASIP)Schubert平檯提齣瞭加法捨人移位指令和兩級條件比較指令,併給齣瞭其專用數據通路的設計實現.根據算法分支執行分佈情況優化瞭算法中分支選擇部分的實現,保證瞭代碼的高併行度.時鐘精確指令集倣真器的運行結果錶明,完成彊度為4的4×4像素塊邊界濾波需要140箇時鐘週期,而完成彊度小于4的邊界濾波需要100箇時鐘週期.運行1/4共享中間格式(QCIF)測試序列時,較x264中的Intel MMX指令實現性能有48%~63%的提升.實驗結果錶明,使用ASIP實現,可以顯著提高去塊效應濾波的性能;同時由于其可編程性,可以適應多箇視頻標準.
침대H.264/AVC배내거괴효응려파기산법중분지밀집、분지판단조건산생복잡,이급가변계수유한충격향응(FIR)려파산법복잡도고등성능병경,기우전용지령집처리기(ASIP)Schubert평태제출료가법사인이위지령화량급조건비교지령,병급출료기전용수거통로적설계실현.근거산법분지집행분포정황우화료산법중분지선택부분적실현,보증료대마적고병행도.시종정학지령집방진기적운행결과표명,완성강도위4적4×4상소괴변계려파수요140개시종주기,이완성강도소우4적변계려파수요100개시종주기.운행1/4공향중간격식(QCIF)측시서렬시,교x264중적Intel MMX지령실현성능유48%~63%적제승.실험결과표명,사용ASIP실현,가이현저제고거괴효응려파적성능;동시유우기가편정성,가이괄응다개시빈표준.