信息技术
信息技術
신식기술
INFORMATION TECHNOLOGY
2009年
5期
40-42,45
,共4页
汉语分词%词典查询%中文信息处理
漢語分詞%詞典查詢%中文信息處理
한어분사%사전사순%중문신식처리
汉语自动分词是汉语信息处理的前提,词典是汉语自动分词的基础,分词词典机制的优劣直接影响到中文分词的速度和效率.针对常用的分词方法--正向匹配分词法的特征,在已有整词二分词典的基础上加以改进,设计了一种基于Hash索引、二叉树以及动态一维数组结构的中文分词词典,相对于传统的基于Hash索引的分词词典,减小了词典的空间复杂度,提高了汉语分词的速度,最主要的是改进后的词典在增添新词时比以往的词典更为容易.
漢語自動分詞是漢語信息處理的前提,詞典是漢語自動分詞的基礎,分詞詞典機製的優劣直接影響到中文分詞的速度和效率.針對常用的分詞方法--正嚮匹配分詞法的特徵,在已有整詞二分詞典的基礎上加以改進,設計瞭一種基于Hash索引、二扠樹以及動態一維數組結構的中文分詞詞典,相對于傳統的基于Hash索引的分詞詞典,減小瞭詞典的空間複雜度,提高瞭漢語分詞的速度,最主要的是改進後的詞典在增添新詞時比以往的詞典更為容易.
한어자동분사시한어신식처리적전제,사전시한어자동분사적기출,분사사전궤제적우렬직접영향도중문분사적속도화효솔.침대상용적분사방법--정향필배분사법적특정,재이유정사이분사전적기출상가이개진,설계료일충기우Hash색인、이차수이급동태일유수조결구적중문분사사전,상대우전통적기우Hash색인적분사사전,감소료사전적공간복잡도,제고료한어분사적속도,최주요적시개진후적사전재증첨신사시비이왕적사전경위용역.