东南大学学报(自然科学版)
東南大學學報(自然科學版)
동남대학학보(자연과학판)
JOURNAL OF SOUTHEAST UNIVERSITY
2015年
2期
219-223
,共5页
卜爱国%余翩翩%吴建兵%单伟伟
蔔愛國%餘翩翩%吳建兵%單偉偉
복애국%여편편%오건병%단위위
低功耗%自适应时钟门控%流水线阻塞
低功耗%自適應時鐘門控%流水線阻塞
저공모%자괄응시종문공%류수선조새
low power%adaptive clock-gating%pipeline stall
提出了一种CPU的功耗优化方法,即通过自适应时钟门控来解决CPU中由于流水线阻塞、浮点处理器(FPU)和多媒体协处理器空闲所导致的动态功耗浪费.首先,设计了模块级自适应时钟门控单元,并通过芯片内部硬件电路来自动监测上述模块是否空闲,模块空闲时时钟关闭,从而消除了不需要的时钟翻转带来的模块内部动态功耗消耗.然后,将自适应时钟门控单元应用于国产处理器Unicore-2中,对其流水线阻塞、FPU和多媒体协处理器空闲的产生进行功耗优化.最后,基于TSMC 65 nm工艺下已流片芯片的网表和寄生参数文件,通过反标芯片的波形获得电路翻转率,并用PrimeTime PX工具进行了功耗仿真.仿真结果表明,利用本方法运行Dhrystone,Whestone和Stream三个典型测试程序时可获得18%~28%的功耗收益,其面积代价可以忽略,并对CPU性能没有影响.
提齣瞭一種CPU的功耗優化方法,即通過自適應時鐘門控來解決CPU中由于流水線阻塞、浮點處理器(FPU)和多媒體協處理器空閒所導緻的動態功耗浪費.首先,設計瞭模塊級自適應時鐘門控單元,併通過芯片內部硬件電路來自動鑑測上述模塊是否空閒,模塊空閒時時鐘關閉,從而消除瞭不需要的時鐘翻轉帶來的模塊內部動態功耗消耗.然後,將自適應時鐘門控單元應用于國產處理器Unicore-2中,對其流水線阻塞、FPU和多媒體協處理器空閒的產生進行功耗優化.最後,基于TSMC 65 nm工藝下已流片芯片的網錶和寄生參數文件,通過反標芯片的波形穫得電路翻轉率,併用PrimeTime PX工具進行瞭功耗倣真.倣真結果錶明,利用本方法運行Dhrystone,Whestone和Stream三箇典型測試程序時可穫得18%~28%的功耗收益,其麵積代價可以忽略,併對CPU性能沒有影響.
제출료일충CPU적공모우화방법,즉통과자괄응시종문공래해결CPU중유우류수선조새、부점처리기(FPU)화다매체협처리기공한소도치적동태공모낭비.수선,설계료모괴급자괄응시종문공단원,병통과심편내부경건전로래자동감측상술모괴시부공한,모괴공한시시종관폐,종이소제료불수요적시종번전대래적모괴내부동태공모소모.연후,장자괄응시종문공단원응용우국산처리기Unicore-2중,대기류수선조새、FPU화다매체협처리기공한적산생진행공모우화.최후,기우TSMC 65 nm공예하이류편심편적망표화기생삼수문건,통과반표심편적파형획득전로번전솔,병용PrimeTime PX공구진행료공모방진.방진결과표명,이용본방법운행Dhrystone,Whestone화Stream삼개전형측시정서시가획득18%~28%적공모수익,기면적대개가이홀략,병대CPU성능몰유영향.