山东商业职业技术学院学报
山東商業職業技術學院學報
산동상업직업기술학원학보
JOURNAL OF SHANDONG INSTITUTE OF COMMERCE AND TECHNOLOGY
2012年
4期
88-92
,共5页
人工智能%自然语言处理%中文四字姓名识别%隐马尔科夫模型
人工智能%自然語言處理%中文四字姓名識彆%隱馬爾科伕模型
인공지능%자연어언처리%중문사자성명식별%은마이과부모형
artificial intelligence%natural language processing%name recognition%HMM
采用统计方法来识别中文四字姓名。该方法将中文四字姓名的识别过程分为姓名候选和姓名求精两个阶段。采用二元隐马尔科夫模型从已经切分好的文本中候选姓名。利用边界规则对候选姓名进行求精。实验结果表明,该方法的召回率为82.9%,准确率为87.3%。
採用統計方法來識彆中文四字姓名。該方法將中文四字姓名的識彆過程分為姓名候選和姓名求精兩箇階段。採用二元隱馬爾科伕模型從已經切分好的文本中候選姓名。利用邊界規則對候選姓名進行求精。實驗結果錶明,該方法的召迴率為82.9%,準確率為87.3%。
채용통계방법래식별중문사자성명。해방법장중문사자성명적식별과정분위성명후선화성명구정량개계단。채용이원은마이과부모형종이경절분호적문본중후선성명。이용변계규칙대후선성명진행구정。실험결과표명,해방법적소회솔위82.9%,준학솔위87.3%。
Automatic recognition of Chinese four character name is an important part of Chinese Named Entity recognition. The Chinese fourcharacter name recognition process can be divided into two stages, namely, the name candidate and the name of refinement. A Hidden Markov Model (HMM) is applied for the extraction of candidate names from text. The boundary rule on candidate names is used for the refinement. The test experiments show that the precision and recall rate reach 87.3% and 82.9% respectively.