信息安全与通信保密
信息安全與通信保密
신식안전여통신보밀
CHINA INFORMATION SECURITY
2014年
11期
88-91
,共4页
编码规则%中文检索%CSPM算法
編碼規則%中文檢索%CSPM算法
편마규칙%중문검색%CSPM산법
encoding rule%Chinese retrieval%CSPM algorithm
文中主要对KMP算法、BM算法、Sunday算法进行了研究分析,根据中文汉字在计算机中的编码规则,提出了一种用于中文检索的CSPM算法。该算法充分利用已匹配信息,实现了待匹配文本串指针和模式串指针均不回溯,增大了跳跃距离,有效地提高了匹配速率。实验结果显示,CSPM算法较其他几种算法有更好的时间性能。
文中主要對KMP算法、BM算法、Sunday算法進行瞭研究分析,根據中文漢字在計算機中的編碼規則,提齣瞭一種用于中文檢索的CSPM算法。該算法充分利用已匹配信息,實現瞭待匹配文本串指針和模式串指針均不迴溯,增大瞭跳躍距離,有效地提高瞭匹配速率。實驗結果顯示,CSPM算法較其他幾種算法有更好的時間性能。
문중주요대KMP산법、BM산법、Sunday산법진행료연구분석,근거중문한자재계산궤중적편마규칙,제출료일충용우중문검색적CSPM산법。해산법충분이용이필배신식,실현료대필배문본천지침화모식천지침균불회소,증대료도약거리,유효지제고료필배속솔。실험결과현시,CSPM산법교기타궤충산법유경호적시간성능。
This paper discusses and analyzes some single-pattern matching algorithms such as KMP,BM and Sunday algorithm,and proposes a CSPM algorithm suitable for Chinese retrieval based on the encoding rules of Chinese characters in computer. By taking full advantage of the matched information,this algorithm could achieve the goal of guaranteeing both the main string pointer and pattern string pointer against back-tracing,increase the leap distance and effectively improve the matching rate. Experiment result inidcates that the CSPM algorithm enjoys better time performance compared with other algorithms.