软件导刊
軟件導刊
연건도간
SOFT WARE GUIDE
2012年
3期
57-59
,共3页
内容过滤%多模式串匹配%自动机%DFA
內容過濾%多模式串匹配%自動機%DFA
내용과려%다모식천필배%자동궤%DFA
经典的关键词表达式(query expressiont keywords expression)是搜索引擎(web retrieve)和数据库等使用的查询语言.但是在网络内容分析系统中,如果单纯使用关键词作为查询条件,会存在很多误报情况,所以网络内容分析系统一般采用表达式作为查询条件.提出了一种新关键词表达式匹配算法.这种算法改进了经典计数算法( predicate counting algorithm)中不适合网络内容分析环境的数据结构,对比计数算法需要平方级的算法复杂度,新算法可以在线性复杂度内容扫描阶段完成关键词表达式匹配工作.新算法去除了底层多串匹配性能的影响,并通过更多的内存占用,在匹配速度方面可以提高近200%.
經典的關鍵詞錶達式(query expressiont keywords expression)是搜索引擎(web retrieve)和數據庫等使用的查詢語言.但是在網絡內容分析繫統中,如果單純使用關鍵詞作為查詢條件,會存在很多誤報情況,所以網絡內容分析繫統一般採用錶達式作為查詢條件.提齣瞭一種新關鍵詞錶達式匹配算法.這種算法改進瞭經典計數算法( predicate counting algorithm)中不適閤網絡內容分析環境的數據結構,對比計數算法需要平方級的算法複雜度,新算法可以在線性複雜度內容掃描階段完成關鍵詞錶達式匹配工作.新算法去除瞭底層多串匹配性能的影響,併通過更多的內存佔用,在匹配速度方麵可以提高近200%.
경전적관건사표체식(query expressiont keywords expression)시수색인경(web retrieve)화수거고등사용적사순어언.단시재망락내용분석계통중,여과단순사용관건사작위사순조건,회존재흔다오보정황,소이망락내용분석계통일반채용표체식작위사순조건.제출료일충신관건사표체식필배산법.저충산법개진료경전계수산법( predicate counting algorithm)중불괄합망락내용분석배경적수거결구,대비계수산법수요평방급적산법복잡도,신산법가이재선성복잡도내용소묘계단완성관건사표체식필배공작.신산법거제료저층다천필배성능적영향,병통과경다적내존점용,재필배속도방면가이제고근200%.