计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2013年
10期
147-149
,共3页
施水才%王锴%韩艳铧%吕学强
施水纔%王鍇%韓豔鏵%呂學彊
시수재%왕개%한염화%려학강
领域术语%条件随机场%词性组合%特征模板
領域術語%條件隨機場%詞性組閤%特徵模闆
영역술어%조건수궤장%사성조합%특정모판
terminology%Conditional Random Field(CRF)%Part Of Speech(POS)combination%feature template
领域术语是各个领域的核心词汇,在研究了大量领域文献的基础上,提出了一种识别领域术语的方法.该方法以现有成熟工具为依托,使用条件随机场模型统计领域术语的词性组合概率.在选定特征集后,通过调整特征和窗口的组合,制定一个最优特征模板,同时通过10倍交叉验证法确定模型训练参数.实验结果表明,通过条件随机场模型分析领域术语的词性组合概率能够有效地识别领域术语.
領域術語是各箇領域的覈心詞彙,在研究瞭大量領域文獻的基礎上,提齣瞭一種識彆領域術語的方法.該方法以現有成熟工具為依託,使用條件隨機場模型統計領域術語的詞性組閤概率.在選定特徵集後,通過調整特徵和窗口的組閤,製定一箇最優特徵模闆,同時通過10倍交扠驗證法確定模型訓練參數.實驗結果錶明,通過條件隨機場模型分析領域術語的詞性組閤概率能夠有效地識彆領域術語.
영역술어시각개영역적핵심사회,재연구료대량영역문헌적기출상,제출료일충식별영역술어적방법.해방법이현유성숙공구위의탁,사용조건수궤장모형통계영역술어적사성조합개솔.재선정특정집후,통과조정특정화창구적조합,제정일개최우특정모판,동시통과10배교차험증법학정모형훈련삼수.실험결과표명,통과조건수궤장모형분석영역술어적사성조합개솔능구유효지식별영역술어.
Terminology is the key word in all fields. This paper describes a method to recognize terminology based on researches on domain literature. Relying on the existing mature tools, this method uses CRF model to calculate the probability of POS com-bination. After choosing the set of features, it proposes an optimal feature template through adjusting features and window com-bination. Meanwhile, it uses 10-fold cross-validation method to determine training parameters of the model. The experimental result shows that the method proposed is a practical reference for terminology recognition.