计算机学报
計算機學報
계산궤학보
CHINESE JOURNAL OF COMPUTERS
2008年
11期
1918-1928
,共11页
林伟%叶笑春%宋风龙%张浩
林偉%葉笑春%宋風龍%張浩
림위%협소춘%송풍룡%장호
众核%写掩码%写掩码缓存%域一致性%伪共享%写无效%写更新
衆覈%寫掩碼%寫掩碼緩存%域一緻性%偽共享%寫無效%寫更新
음핵%사엄마%사엄마완존%역일치성%위공향%사무효%사경신
高速缓存采用写回策略,能极大地节省对片上网络和访存带宽的消耗,这对于片上众核(大于16核)的结构尤为重要.与通常多核系统中基于目录/总线的写无效或写更新协议不同,文中给出了片上实现域一致性存储模型和基于硬件锁的缓存一致性协议的方案并提出了在L1高速缓存保存写掩码的方法,用以记录本地更新缓存块的字节位置,解决了写回策略下伪共享带来的缓存一致性问题.文中还进一步提出两种优化掩码存储空间开销的新方法:通过设定程序中较少出现的、长度为1~3字节的写指令为写穿透,在L1中每4字节设置一位写掩码,将写掩码的芯片面积开销压缩到字节粒度的27.9%;设计项数为L1缓存块总数12.5%的多路写掩码缓存,在不损失性能的情况下,将面积开销压缩到字节粒度的17.7%.搭建的众核平台Godson-T采用域一致性存储模型,使用写掩码实现混合写回/写穿透缓存策略(临界区内写穿透,临界区外写回).实验使用splash2的3个程序和2个生物计算程序进行评估.结果表明,相对于完全写穿透,混合写回策略在32和64线程的配置下普遍获得24%以上的性能提升,性能略优于完全写回,并且采用两种优化空间开销的新方法后性能无损失.
高速緩存採用寫迴策略,能極大地節省對片上網絡和訪存帶寬的消耗,這對于片上衆覈(大于16覈)的結構尤為重要.與通常多覈繫統中基于目錄/總線的寫無效或寫更新協議不同,文中給齣瞭片上實現域一緻性存儲模型和基于硬件鎖的緩存一緻性協議的方案併提齣瞭在L1高速緩存保存寫掩碼的方法,用以記錄本地更新緩存塊的字節位置,解決瞭寫迴策略下偽共享帶來的緩存一緻性問題.文中還進一步提齣兩種優化掩碼存儲空間開銷的新方法:通過設定程序中較少齣現的、長度為1~3字節的寫指令為寫穿透,在L1中每4字節設置一位寫掩碼,將寫掩碼的芯片麵積開銷壓縮到字節粒度的27.9%;設計項數為L1緩存塊總數12.5%的多路寫掩碼緩存,在不損失性能的情況下,將麵積開銷壓縮到字節粒度的17.7%.搭建的衆覈平檯Godson-T採用域一緻性存儲模型,使用寫掩碼實現混閤寫迴/寫穿透緩存策略(臨界區內寫穿透,臨界區外寫迴).實驗使用splash2的3箇程序和2箇生物計算程序進行評估.結果錶明,相對于完全寫穿透,混閤寫迴策略在32和64線程的配置下普遍穫得24%以上的性能提升,性能略優于完全寫迴,併且採用兩種優化空間開銷的新方法後性能無損失.
고속완존채용사회책략,능겁대지절성대편상망락화방존대관적소모,저대우편상음핵(대우16핵)적결구우위중요.여통상다핵계통중기우목록/총선적사무효혹사경신협의불동,문중급출료편상실현역일치성존저모형화기우경건쇄적완존일치성협의적방안병제출료재L1고속완존보존사엄마적방법,용이기록본지경신완존괴적자절위치,해결료사회책략하위공향대래적완존일치성문제.문중환진일보제출량충우화엄마존저공간개소적신방법:통과설정정서중교소출현적、장도위1~3자절적사지령위사천투,재L1중매4자절설치일위사엄마,장사엄마적심편면적개소압축도자절립도적27.9%;설계항수위L1완존괴총수12.5%적다로사엄마완존,재불손실성능적정황하,장면적개소압축도자절립도적17.7%.탑건적음핵평태Godson-T채용역일치성존저모형,사용사엄마실현혼합사회/사천투완존책략(림계구내사천투,림계구외사회).실험사용splash2적3개정서화2개생물계산정서진행평고.결과표명,상대우완전사천투,혼합사회책략재32화64선정적배치하보편획득24%이상적성능제승,성능략우우완전사회,병차채용량충우화공간개소적신방법후성능무손실.