广西师范大学学报(自然科学版)
廣西師範大學學報(自然科學版)
엄서사범대학학보(자연과학판)
JOURNAL OF GUANGXI NORMAL UNIVERSITY(NATURAL SCIENCE EDITION)
2008年
1期
134-138
,共5页
杨来%何清%许立达%史忠植
楊來%何清%許立達%史忠植
양래%하청%허립체%사충식
机器检索%唯一性%程序设计%自然语言处理
機器檢索%唯一性%程序設計%自然語言處理
궤기검색%유일성%정서설계%자연어언처리
分词是中文信息处理的基础,词典查询又是分词的基础.另外,搜索引擎需要对访问过的URL进行唯一性检测.针对汉语词典查询和唯一性检测这两个问题,提出Dynamic Hash TRIE词典算法,有效地压缩了节点,没有单链树枝.通过Java和C++编程实验,对比了多个同类算法,证明该算法对于中文词典具有较高的查询性能,灵活的可拓展性.另外还提出了一个词库测试的标准NormTest,可以排除机器性能的干扰来对比各种算法.
分詞是中文信息處理的基礎,詞典查詢又是分詞的基礎.另外,搜索引擎需要對訪問過的URL進行唯一性檢測.針對漢語詞典查詢和唯一性檢測這兩箇問題,提齣Dynamic Hash TRIE詞典算法,有效地壓縮瞭節點,沒有單鏈樹枝.通過Java和C++編程實驗,對比瞭多箇同類算法,證明該算法對于中文詞典具有較高的查詢性能,靈活的可拓展性.另外還提齣瞭一箇詞庫測試的標準NormTest,可以排除機器性能的榦擾來對比各種算法.
분사시중문신식처리적기출,사전사순우시분사적기출.령외,수색인경수요대방문과적URL진행유일성검측.침대한어사전사순화유일성검측저량개문제,제출Dynamic Hash TRIE사전산법,유효지압축료절점,몰유단련수지.통과Java화C++편정실험,대비료다개동류산법,증명해산법대우중문사전구유교고적사순성능,령활적가탁전성.령외환제출료일개사고측시적표준NormTest,가이배제궤기성능적간우래대비각충산법.