南京邮电大学学报(自然科学版)
南京郵電大學學報(自然科學版)
남경유전대학학보(자연과학판)
JOURNAL OF NANJING UNIVERSITY OF POSTS AND TELECOMMUNICATIONS(NATURAL SCIENCE)
2013年
6期
112-117
,共6页
中文信息处理%组合型分词%交集型歧义
中文信息處理%組閤型分詞%交集型歧義
중문신식처리%조합형분사%교집형기의
Chinese information processing%combination-type segmentation%crossing ambiguity
在分词过程中如何处理歧义切分是中文分词算法要解决的难点之一.文中提出了一种改进的基于词典和基于统计的组合中文分词算法,能够发现并处理交集型歧义,该算法在发现歧义的过程中没有采取传统的双向匹配法而是采用双栈的结构,减少了匹配花费时间,并分别采取长词优先和最大概率方法处理一般的交集型歧义和特殊的同词长交集型歧义.最后通过实例对文中所提出的算法进行实验验证,结果表明该算法比传统的分词算法有更好的准确率.
在分詞過程中如何處理歧義切分是中文分詞算法要解決的難點之一.文中提齣瞭一種改進的基于詞典和基于統計的組閤中文分詞算法,能夠髮現併處理交集型歧義,該算法在髮現歧義的過程中沒有採取傳統的雙嚮匹配法而是採用雙棧的結構,減少瞭匹配花費時間,併分彆採取長詞優先和最大概率方法處理一般的交集型歧義和特殊的同詞長交集型歧義.最後通過實例對文中所提齣的算法進行實驗驗證,結果錶明該算法比傳統的分詞算法有更好的準確率.
재분사과정중여하처리기의절분시중문분사산법요해결적난점지일.문중제출료일충개진적기우사전화기우통계적조합중문분사산법,능구발현병처리교집형기의,해산법재발현기의적과정중몰유채취전통적쌍향필배법이시채용쌍잔적결구,감소료필배화비시간,병분별채취장사우선화최대개솔방법처리일반적교집형기의화특수적동사장교집형기의.최후통과실례대문중소제출적산법진행실험험증,결과표명해산법비전통적분사산법유경호적준학솔.