计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2010年
31期
135-138
,共4页
冯鲸华%古丽拉·阿东别克%玛依来·哈帕尔
馮鯨華%古麗拉·阿東彆剋%瑪依來·哈帕爾
풍경화%고려랍·아동별극%마의래·합파이
N-gram%语言模型%哈萨克文机构名识别%实体名识别
N-gram%語言模型%哈薩剋文機構名識彆%實體名識彆
N-gram%어언모형%합살극문궤구명식별%실체명식별
针对哈萨克文文本中机构名构成特点,提出了一种基于N-gram语言模型的哈萨克文机构名可信度计算方法,并以机构名尾词为触发词,构建了一个哈萨克文机构名识别系统.系统分为训练和识别两个模块,识别过程是:首先从训练语料中提取特征进行训练,得到一个特征训练模型,然后利用训练好的特征模型及少量的附加规则,对测试文本中的机构名进行识别,实验结果表明该方法可行.
針對哈薩剋文文本中機構名構成特點,提齣瞭一種基于N-gram語言模型的哈薩剋文機構名可信度計算方法,併以機構名尾詞為觸髮詞,構建瞭一箇哈薩剋文機構名識彆繫統.繫統分為訓練和識彆兩箇模塊,識彆過程是:首先從訓練語料中提取特徵進行訓練,得到一箇特徵訓練模型,然後利用訓練好的特徵模型及少量的附加規則,對測試文本中的機構名進行識彆,實驗結果錶明該方法可行.
침대합살극문문본중궤구명구성특점,제출료일충기우N-gram어언모형적합살극문궤구명가신도계산방법,병이궤구명미사위촉발사,구건료일개합살극문궤구명식별계통.계통분위훈련화식별량개모괴,식별과정시:수선종훈련어료중제취특정진행훈련,득도일개특정훈련모형,연후이용훈련호적특정모형급소량적부가규칙,대측시문본중적궤구명진행식별,실험결과표명해방법가행.