计算机学报
計算機學報
계산궤학보
CHINESE JOURNAL OF COMPUTERS
2011年
1期
143-153
,共11页
隋秀峰%吴俊敏%陈国良%唐轶轩
隋秀峰%吳俊敏%陳國良%唐軼軒
수수봉%오준민%진국량%당질헌
多核%共享高速缓存%插入策略%替换算法%基于计数的算法
多覈%共享高速緩存%插入策略%替換算法%基于計數的算法
다핵%공향고속완존%삽입책략%체환산법%기우계수적산법
当代CMP处理器通常采用基于LRU替换策略或其近似算法的共享最后一级Cache设计.然而,随着LLC容量和相联度的增长,LRU和理论最优替换算法之间的性能差距日趋增大.为此已提出多种Cache管理策略来解决这一问题,但是它们多数仅针对单一的内存访问类型,且对Cache访问的频率信息关注较少,因而性能提升具有很大的局限性.文中提出一种统一的Cache管理策略ELF,不仅可以覆盖多种访存行为,而且能够同时考虑程序中数据的临近性和使用频率信息.根据LLC中Cache块在其生命期内使用频率较低这一实验结果,ELF策略能够(1)通过基于计数的算法预测出无用块并将其尽早替换;(2)通过动态插入和提升策略过滤低重用数据,从而尽量保留那些潜在的活动数据并且使得一部分工作集免受低使用频率数据的干扰.在4路CMPs上的实验结果显示,ELF可以将全局性能平均提升14.5%,同时与PIPP和TADIP相比,可以分别达到1.06倍和1.09倍的加速比.
噹代CMP處理器通常採用基于LRU替換策略或其近似算法的共享最後一級Cache設計.然而,隨著LLC容量和相聯度的增長,LRU和理論最優替換算法之間的性能差距日趨增大.為此已提齣多種Cache管理策略來解決這一問題,但是它們多數僅針對單一的內存訪問類型,且對Cache訪問的頻率信息關註較少,因而性能提升具有很大的跼限性.文中提齣一種統一的Cache管理策略ELF,不僅可以覆蓋多種訪存行為,而且能夠同時攷慮程序中數據的臨近性和使用頻率信息.根據LLC中Cache塊在其生命期內使用頻率較低這一實驗結果,ELF策略能夠(1)通過基于計數的算法預測齣無用塊併將其儘早替換;(2)通過動態插入和提升策略過濾低重用數據,從而儘量保留那些潛在的活動數據併且使得一部分工作集免受低使用頻率數據的榦擾.在4路CMPs上的實驗結果顯示,ELF可以將全跼性能平均提升14.5%,同時與PIPP和TADIP相比,可以分彆達到1.06倍和1.09倍的加速比.
당대CMP처리기통상채용기우LRU체환책략혹기근사산법적공향최후일급Cache설계.연이,수착LLC용량화상련도적증장,LRU화이론최우체환산법지간적성능차거일추증대.위차이제출다충Cache관리책략래해결저일문제,단시타문다수부침대단일적내존방문류형,차대Cache방문적빈솔신식관주교소,인이성능제승구유흔대적국한성.문중제출일충통일적Cache관리책략ELF,불부가이복개다충방존행위,이차능구동시고필정서중수거적림근성화사용빈솔신식.근거LLC중Cache괴재기생명기내사용빈솔교저저일실험결과,ELF책략능구(1)통과기우계수적산법예측출무용괴병장기진조체환;(2)통과동태삽입화제승책략과려저중용수거,종이진량보류나사잠재적활동수거병차사득일부분공작집면수저사용빈솔수거적간우.재4로CMPs상적실험결과현시,ELF가이장전국성능평균제승14.5%,동시여PIPP화TADIP상비,가이분별체도1.06배화1.09배적가속비.