软件学报
軟件學報
연건학보
JOURNAL OF SOFTWARE
2013年
7期
1650-1665
,共16页
嵩天%李冬妮%汪东升%薛一波
嵩天%李鼕妮%汪東升%薛一波
숭천%리동니%왕동승%설일파
模式匹配%网络安全%网络入侵检测%有限状态自动机%大规模
模式匹配%網絡安全%網絡入侵檢測%有限狀態自動機%大規模
모식필배%망락안전%망락입침검측%유한상태자동궤%대규모
pattern matching%network security%network intrusion detection%finite state automata%large scale
多模式匹配是基于内容检测的网络安全系统的重要功能,同时,它在很多领域具有广泛的应用.实际应用中,高速且性能稳定的大规模模式匹配方法需求迫切,尤其是能够在线实时处理网络包的匹配体系结构.介绍了一种存储有效的高速大规模模式匹配算法及相关体系结构.研究从算法所基于的理论入手,提出了缓存状态机模型,并结合状态机中转换规则分类,提出了交叉转换规则动态生成的匹配算法 ACC(Aho-Corasick-CDFA).该算法通过动态生成转换规则降低了生成状态机的规模,适用于大规模模式集.进一步提出了基于该算法的体系结构设计.采用网络安全系统中真实模式集进行的实验结果表明,该算法相比其他状态机类模式匹配算法,可以进一步减少80%~95%的状态机规模,存储空间降低40.7%,存储效率提高近2倍,算法单硬件结构实现可以达到11Gbps的匹配速度.
多模式匹配是基于內容檢測的網絡安全繫統的重要功能,同時,它在很多領域具有廣汎的應用.實際應用中,高速且性能穩定的大規模模式匹配方法需求迫切,尤其是能夠在線實時處理網絡包的匹配體繫結構.介紹瞭一種存儲有效的高速大規模模式匹配算法及相關體繫結構.研究從算法所基于的理論入手,提齣瞭緩存狀態機模型,併結閤狀態機中轉換規則分類,提齣瞭交扠轉換規則動態生成的匹配算法 ACC(Aho-Corasick-CDFA).該算法通過動態生成轉換規則降低瞭生成狀態機的規模,適用于大規模模式集.進一步提齣瞭基于該算法的體繫結構設計.採用網絡安全繫統中真實模式集進行的實驗結果錶明,該算法相比其他狀態機類模式匹配算法,可以進一步減少80%~95%的狀態機規模,存儲空間降低40.7%,存儲效率提高近2倍,算法單硬件結構實現可以達到11Gbps的匹配速度.
다모식필배시기우내용검측적망락안전계통적중요공능,동시,타재흔다영역구유엄범적응용.실제응용중,고속차성능은정적대규모모식필배방법수구박절,우기시능구재선실시처리망락포적필배체계결구.개소료일충존저유효적고속대규모모식필배산법급상관체계결구.연구종산법소기우적이론입수,제출료완존상태궤모형,병결합상태궤중전환규칙분류,제출료교차전환규칙동태생성적필배산법 ACC(Aho-Corasick-CDFA).해산법통과동태생성전환규칙강저료생성상태궤적규모,괄용우대규모모식집.진일보제출료기우해산법적체계결구설계.채용망락안전계통중진실모식집진행적실험결과표명,해산법상비기타상태궤류모식필배산법,가이진일보감소80%~95%적상태궤규모,존저공간강저40.7%,존저효솔제고근2배,산법단경건결구실현가이체도11Gbps적필배속도.
Pattern matching is the main part of content inspection based network security systems, and it is widely used in many other applications. In practice, pattern matching methods for large scale sets with stable performance are in great demand, especially the architecture for online real-time processing. This paper presents a memory efficient pattern matching algorithm and architecture for a large scale set. This paper first proposes cached deterministic finite automata, namely CDFA, in the view of basic theory. By classifying transitions in pattern DFA, a new algorithm, ACC, based on CDFA is addressed. This algorithm can dynamically generate cross transitions and save most of memory resources, so that it can support large scale pattern set. Further, an architecture based on this method is proposed. Experiments on real pattern sets show that the number of transition rules can be reduced 80%~95% than the current most optimized algorithms. At the same time, it can save 40.7% memory space, nearly 2 times memory efficiency. The corresponding architecture in single chip can achieve about 11Gbps matching performance.