计算机研究与发展
計算機研究與髮展
계산궤연구여발전
JOURNAL OF COMPUTER RESEARCH AND DEVELOPMENT
2008年
7期
1269-1277
,共9页
同时多线程%共享高速缓存%动态划分%动态组采样%高速缓存公平性
同時多線程%共享高速緩存%動態劃分%動態組採樣%高速緩存公平性
동시다선정%공향고속완존%동태화분%동태조채양%고속완존공평성
同时多线程是一种延迟容忍的体系结构,采用共享的二级Cache,在每个周期内可以执行多个线程的多条指令,这就会增加对存储层次的压力,文中主要研究了SMT处理器中多个并发执行的线程之间共享Cache的划分问题,尤其是Cache共享中的公平性问题以及它和吞吐量之间的关系,传统的LRU策略会根据线程的需要隐式地划分共享Cache,给具有较高需求的线程分配较多的Cache空间,对Cache的管理具有不公平性,从而会引起线程饿死、优先级反转等问题,实现了一种自适应、运行时划分机制(ARP)来管理共享Cache.ARP采用公平性作为划分的度量,并且使用动态划分算法来优化公平性,该算法具有易于实现,所需剖析较少的特点,硬件上使用经典的监控器来收集每个线程的栈距离信息,其存储开销不到0.25%.实验结果显示,与基于LRU的Cache划分相比,ARP可以将一个2路SMT处理器的公平性提高2.26倍,而将吞吐量平均提高14.75%.
同時多線程是一種延遲容忍的體繫結構,採用共享的二級Cache,在每箇週期內可以執行多箇線程的多條指令,這就會增加對存儲層次的壓力,文中主要研究瞭SMT處理器中多箇併髮執行的線程之間共享Cache的劃分問題,尤其是Cache共享中的公平性問題以及它和吞吐量之間的關繫,傳統的LRU策略會根據線程的需要隱式地劃分共享Cache,給具有較高需求的線程分配較多的Cache空間,對Cache的管理具有不公平性,從而會引起線程餓死、優先級反轉等問題,實現瞭一種自適應、運行時劃分機製(ARP)來管理共享Cache.ARP採用公平性作為劃分的度量,併且使用動態劃分算法來優化公平性,該算法具有易于實現,所需剖析較少的特點,硬件上使用經典的鑑控器來收集每箇線程的棧距離信息,其存儲開銷不到0.25%.實驗結果顯示,與基于LRU的Cache劃分相比,ARP可以將一箇2路SMT處理器的公平性提高2.26倍,而將吞吐量平均提高14.75%.
동시다선정시일충연지용인적체계결구,채용공향적이급Cache,재매개주기내가이집행다개선정적다조지령,저취회증가대존저층차적압력,문중주요연구료SMT처리기중다개병발집행적선정지간공향Cache적화분문제,우기시Cache공향중적공평성문제이급타화탄토량지간적관계,전통적LRU책략회근거선정적수요은식지화분공향Cache,급구유교고수구적선정분배교다적Cache공간,대Cache적관리구유불공평성,종이회인기선정아사、우선급반전등문제,실현료일충자괄응、운행시화분궤제(ARP)래관리공향Cache.ARP채용공평성작위화분적도량,병차사용동태화분산법래우화공평성,해산법구유역우실현,소수부석교소적특점,경건상사용경전적감공기래수집매개선정적잔거리신식,기존저개소불도0.25%.실험결과현시,여기우LRU적Cache화분상비,ARP가이장일개2로SMT처리기적공평성제고2.26배,이장탄토량평균제고14.75%.