鞍山师范学院学报
鞍山師範學院學報
안산사범학원학보
JOURNAL OF ANSHAN TEACHERS COLLEGE
2010年
4期
46-48
,共3页
中文分词%近邻匹配%分词系统
中文分詞%近鄰匹配%分詞繫統
중문분사%근린필배%분사계통
提出一种基于近邻匹配新的分词算法Jlppeccz,该算法首先把一篇文章以标点符号为界线分成若干个句子,然后用近邻匹配方法把一句话切分成1~4字的词,通过对词库的搜索,对已分的词进行重组,把小词合并成大词,再将处理过的词存储到一个临时的词库里,以备后续的句子查找,并可实现对词库添加词的功能.与经典MM算法和词频统计方法相比,本文算法有较大的改进.
提齣一種基于近鄰匹配新的分詞算法Jlppeccz,該算法首先把一篇文章以標點符號為界線分成若榦箇句子,然後用近鄰匹配方法把一句話切分成1~4字的詞,通過對詞庫的搜索,對已分的詞進行重組,把小詞閤併成大詞,再將處理過的詞存儲到一箇臨時的詞庫裏,以備後續的句子查找,併可實現對詞庫添加詞的功能.與經典MM算法和詞頻統計方法相比,本文算法有較大的改進.
제출일충기우근린필배신적분사산법Jlppeccz,해산법수선파일편문장이표점부호위계선분성약간개구자,연후용근린필배방법파일구화절분성1~4자적사,통과대사고적수색,대이분적사진행중조,파소사합병성대사,재장처리과적사존저도일개림시적사고리,이비후속적구자사조,병가실현대사고첨가사적공능.여경전MM산법화사빈통계방법상비,본문산법유교대적개진.