计算机学报
計算機學報
계산궤학보
CHINESE JOURNAL OF COMPUTERS
2014年
3期
700-720
,共21页
张骏%田泽%梅魁志%赵季中
張駿%田澤%梅魁誌%趙季中
장준%전택%매괴지%조계중
单芯片多处理器(CMP)%预测%一致性协议%目录%可扩展
單芯片多處理器(CMP)%預測%一緻性協議%目錄%可擴展
단심편다처리기(CMP)%예측%일치성협의%목록%가확전
chip multi-processor%prediction%coherence protocol%directory%scalable
处理器性能的提升依赖于对存储系统性能的挖掘.随着片上集成内核数量的不断增大和特征尺寸的持续缩小,延迟、存储可扩展的Cache一致性协议已经成为提升访存效率的关键性因素.文中提出一种基于节点预测的直接Cache一致性协议-NPP协议,研究一致性交互延迟隐藏和目录存储开销减少技术.针对读、写缺失中存在的间接性问题和现有解决方案破坏已有数据局部性、无法获得最近数据副本等问题,分别提出节点挂起技术和直接写缺失处理技术,有效隐藏了目录访问延迟.为了实现准确的节点预测,作者还提出基于“签名”回收的历史信息更新算法,避免了冗余更新和不完整更新.使用SPLASH-2测试程序集,在基于2D MESH NoC互联的64核CMP下,相对于全映射目录协议,NPP协议的平均执行时间降幅为21.78%~31.11%;平均读缺失延迟降低14.22%~18.9%;平均写缺失延迟降低17.89%~21.13%.而获得上述性能提升的代价是网络流量平均增加6.62%~7.28%.
處理器性能的提升依賴于對存儲繫統性能的挖掘.隨著片上集成內覈數量的不斷增大和特徵呎吋的持續縮小,延遲、存儲可擴展的Cache一緻性協議已經成為提升訪存效率的關鍵性因素.文中提齣一種基于節點預測的直接Cache一緻性協議-NPP協議,研究一緻性交互延遲隱藏和目錄存儲開銷減少技術.針對讀、寫缺失中存在的間接性問題和現有解決方案破壞已有數據跼部性、無法穫得最近數據副本等問題,分彆提齣節點掛起技術和直接寫缺失處理技術,有效隱藏瞭目錄訪問延遲.為瞭實現準確的節點預測,作者還提齣基于“籤名”迴收的歷史信息更新算法,避免瞭冗餘更新和不完整更新.使用SPLASH-2測試程序集,在基于2D MESH NoC互聯的64覈CMP下,相對于全映射目錄協議,NPP協議的平均執行時間降幅為21.78%~31.11%;平均讀缺失延遲降低14.22%~18.9%;平均寫缺失延遲降低17.89%~21.13%.而穫得上述性能提升的代價是網絡流量平均增加6.62%~7.28%.
처리기성능적제승의뢰우대존저계통성능적알굴.수착편상집성내핵수량적불단증대화특정척촌적지속축소,연지、존저가확전적Cache일치성협의이경성위제승방존효솔적관건성인소.문중제출일충기우절점예측적직접Cache일치성협의-NPP협의,연구일치성교호연지은장화목록존저개소감소기술.침대독、사결실중존재적간접성문제화현유해결방안파배이유수거국부성、무법획득최근수거부본등문제,분별제출절점괘기기술화직접사결실처리기술,유효은장료목록방문연지.위료실현준학적절점예측,작자환제출기우“첨명”회수적역사신식경신산법,피면료용여경신화불완정경신.사용SPLASH-2측시정서집,재기우2D MESH NoC호련적64핵CMP하,상대우전영사목록협의,NPP협의적평균집행시간강폭위21.78%~31.11%;평균독결실연지강저14.22%~18.9%;평균사결실연지강저17.89%~21.13%.이획득상술성능제승적대개시망락류량평균증가6.62%~7.28%.