计算机工程
計算機工程
계산궤공정
COMPUTER ENGINEERING
2011年
23期
177-180
,共4页
合成词提取%词性探测%词共现有向图%自然语言处理%Bellman-Ford算法
閤成詞提取%詞性探測%詞共現有嚮圖%自然語言處理%Bellman-Ford算法
합성사제취%사성탐측%사공현유향도%자연어언처리%Bellman-Ford산법
分词系统由于未将合成词收录进词典,因此不能识别合成词.针对该问题,提出一种基于词共现有向图的中文合成词提取算法.采用词性探测方法从文本中获取词串,由所获词串生成词共现有向图,并借鉴Bellman-Ford算法思想,从词共现有向图中搜索多源点长度最长且权重值满足给定条件的路径,该路径所对应的词串即为合成词.实验结果显示,该算法的合成词提取正确率达到91.16%.
分詞繫統由于未將閤成詞收錄進詞典,因此不能識彆閤成詞.針對該問題,提齣一種基于詞共現有嚮圖的中文閤成詞提取算法.採用詞性探測方法從文本中穫取詞串,由所穫詞串生成詞共現有嚮圖,併藉鑒Bellman-Ford算法思想,從詞共現有嚮圖中搜索多源點長度最長且權重值滿足給定條件的路徑,該路徑所對應的詞串即為閤成詞.實驗結果顯示,該算法的閤成詞提取正確率達到91.16%.
분사계통유우미장합성사수록진사전,인차불능식별합성사.침대해문제,제출일충기우사공현유향도적중문합성사제취산법.채용사성탐측방법종문본중획취사천,유소획사천생성사공현유향도,병차감Bellman-Ford산법사상,종사공현유향도중수색다원점장도최장차권중치만족급정조건적로경,해로경소대응적사천즉위합성사.실험결과현시,해산법적합성사제취정학솔체도91.16%.