计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2009年
4期
227-228,234
,共3页
中国人名识别%最大熵模型%viterbi算法
中國人名識彆%最大熵模型%viterbi算法
중국인명식별%최대적모형%viterbi산법
用最大熵模型自动识别中国人名.首先对语料库的词性进行角色替换,然后用特征模板从角色替换后的语料库中提取出特征集,接着用IIS算法训练特征集的最大熵参数,最后用viterbi算法对初分词文本进行角色标注,并在角色序列的基础上进行模式最大匹配,从而实现中国人名的自动识别.在封闭测试实验中,识别准确率、召回率、F-值分别达到了85.4%、91.2%、88.2%.
用最大熵模型自動識彆中國人名.首先對語料庫的詞性進行角色替換,然後用特徵模闆從角色替換後的語料庫中提取齣特徵集,接著用IIS算法訓練特徵集的最大熵參數,最後用viterbi算法對初分詞文本進行角色標註,併在角色序列的基礎上進行模式最大匹配,從而實現中國人名的自動識彆.在封閉測試實驗中,識彆準確率、召迴率、F-值分彆達到瞭85.4%、91.2%、88.2%.
용최대적모형자동식별중국인명.수선대어료고적사성진행각색체환,연후용특정모판종각색체환후적어료고중제취출특정집,접착용IIS산법훈련특정집적최대적삼수,최후용viterbi산법대초분사문본진행각색표주,병재각색서렬적기출상진행모식최대필배,종이실현중국인명적자동식별.재봉폐측시실험중,식별준학솔、소회솔、F-치분별체도료85.4%、91.2%、88.2%.