计算机科学与探索
計算機科學與探索
계산궤과학여탐색
JOURNAL OF FRONTIERS OF COMPUTER SCIENCE & TECHNOLOGY
2014年
4期
385-396
,共12页
李国红%汪东升%刘振宇%李崇民%刘根贤%郭三川
李國紅%汪東升%劉振宇%李崇民%劉根賢%郭三川
리국홍%왕동승%류진우%리숭민%류근현%곽삼천
多核处理器%高速缓存%片上网络
多覈處理器%高速緩存%片上網絡
다핵처리기%고속완존%편상망락
chip multiprocessors%cache%network on chip
随着多核处理器规模的扩大,请求数据的处理器核到数据的宿主节点之间的平均距离相应增大,并且数据访问在分布式共享高速缓存块中的分布并不均衡引起了网络热点。这些情况导致一级高速缓存缺失延迟的增大。为了解决该问题,将每四个处理器核分为一组,在组内设计邻近数据探测器。邻近数据探测器通过确定一次缺失能否在邻近核的一级高速缓存中得到数据,从而利用了并行程序在多核处理器上执行时数据访问的核间局部性。另外,根据新的结构相应优化了高速缓存一致性协议。实验表明,该片上存储优化方法提高了系统性能,减少了片上网络流量,节省了能耗。
隨著多覈處理器規模的擴大,請求數據的處理器覈到數據的宿主節點之間的平均距離相應增大,併且數據訪問在分佈式共享高速緩存塊中的分佈併不均衡引起瞭網絡熱點。這些情況導緻一級高速緩存缺失延遲的增大。為瞭解決該問題,將每四箇處理器覈分為一組,在組內設計鄰近數據探測器。鄰近數據探測器通過確定一次缺失能否在鄰近覈的一級高速緩存中得到數據,從而利用瞭併行程序在多覈處理器上執行時數據訪問的覈間跼部性。另外,根據新的結構相應優化瞭高速緩存一緻性協議。實驗錶明,該片上存儲優化方法提高瞭繫統性能,減少瞭片上網絡流量,節省瞭能耗。
수착다핵처리기규모적확대,청구수거적처리기핵도수거적숙주절점지간적평균거리상응증대,병차수거방문재분포식공향고속완존괴중적분포병불균형인기료망락열점。저사정황도치일급고속완존결실연지적증대。위료해결해문제,장매사개처리기핵분위일조,재조내설계린근수거탐측기。린근수거탐측기통과학정일차결실능부재린근핵적일급고속완존중득도수거,종이이용료병행정서재다핵처리기상집행시수거방문적핵간국부성。령외,근거신적결구상응우화료고속완존일치성협의。실험표명,해편상존저우화방법제고료계통성능,감소료편상망락류량,절성료능모。
In chip multiprocessors (CMP), as the number of cores increases, the average distance between the requestors and the home nodes becomes longer, and certain hot nodes are incurred by the unbalanced accesses to the different banks of the distributed share cache. These cases lead to the higher average latency of L1 cache misses. To conquer this problem, this paper divides the cores into groups of 2×2 nodes, and introduces the neighboring data prober (NDP). By deciding if a miss can be served by the L1 cache of a neighbor node, NDP can leverage the node-level spatial locality of the data accesses of parallel programs. Also, this paper optimizes the coherence protocol for the new architecture. The evaluation results illustrate that the proposed cache optimization improves the performance, lowers the network traffic and saves energy.