计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2004年
15期
43-45,91
,共4页
歧义标记%规则统计模型%n元语法%词加权算法
歧義標記%規則統計模型%n元語法%詞加權算法
기의표기%규칙통계모형%n원어법%사가권산법
该文针对小型词库,提出了基于规则统计模型的消歧方法和识别未登录词的词加权算法.通过大量语料库学习获取歧义高频字,作为歧义标记,利用规则统计模型对标记的上下文信息分类处理,剩下的部分进行正向或逆向动态最大匹配,对连续单字串使用词加权算法来判断其是否为未登录多字词.经过实验测试,该系统的准确率为98.88%,召回率为98.32%.
該文針對小型詞庫,提齣瞭基于規則統計模型的消歧方法和識彆未登錄詞的詞加權算法.通過大量語料庫學習穫取歧義高頻字,作為歧義標記,利用規則統計模型對標記的上下文信息分類處理,剩下的部分進行正嚮或逆嚮動態最大匹配,對連續單字串使用詞加權算法來判斷其是否為未登錄多字詞.經過實驗測試,該繫統的準確率為98.88%,召迴率為98.32%.
해문침대소형사고,제출료기우규칙통계모형적소기방법화식별미등록사적사가권산법.통과대량어료고학습획취기의고빈자,작위기의표기,이용규칙통계모형대표기적상하문신식분류처리,잉하적부분진행정향혹역향동태최대필배,대련속단자천사용사가권산법래판단기시부위미등록다자사.경과실험측시,해계통적준학솔위98.88%,소회솔위98.32%.