计算机研究与发展
計算機研究與髮展
계산궤연구여발전
JOURNAL OF COMPUTER RESEARCH AND DEVELOPMENT
2009年
1期
62-69
,共8页
信息抽取%术语定义模式%统计语言学模型%支持向量机%句子隶属度
信息抽取%術語定義模式%統計語言學模型%支持嚮量機%句子隸屬度
신식추취%술어정의모식%통계어언학모형%지지향량궤%구자대속도
新术语及其定义抽取是信息抽取的重要研究内容之一.研究结果表明,在科技文献中,一个新术语往往伴随其定义出现,通过考察,在真实文本中,术语定义存在显著的语言表述特征,从大规模真实语料库中,通过考察术语定义构成的语言学模式、定义中词汇和术语周边的统计特征,提出了以术语定义的语言学模式(LPTD)作为待识别候选新术语集,同时考虑到有关新术语出现的上下文统计特征,用SVM分类器方法完成科技语料中新术语及其定义的识别.在大规模科技期刊上进行方法验证,开放性评测结果的精确率为90.5%、召回率达78.1%.
新術語及其定義抽取是信息抽取的重要研究內容之一.研究結果錶明,在科技文獻中,一箇新術語往往伴隨其定義齣現,通過攷察,在真實文本中,術語定義存在顯著的語言錶述特徵,從大規模真實語料庫中,通過攷察術語定義構成的語言學模式、定義中詞彙和術語週邊的統計特徵,提齣瞭以術語定義的語言學模式(LPTD)作為待識彆候選新術語集,同時攷慮到有關新術語齣現的上下文統計特徵,用SVM分類器方法完成科技語料中新術語及其定義的識彆.在大規模科技期刊上進行方法驗證,開放性評測結果的精確率為90.5%、召迴率達78.1%.
신술어급기정의추취시신식추취적중요연구내용지일.연구결과표명,재과기문헌중,일개신술어왕왕반수기정의출현,통과고찰,재진실문본중,술어정의존재현저적어언표술특정,종대규모진실어료고중,통과고찰술어정의구성적어언학모식、정의중사회화술어주변적통계특정,제출료이술어정의적어언학모식(LPTD)작위대식별후선신술어집,동시고필도유관신술어출현적상하문통계특정,용SVM분류기방법완성과기어료중신술어급기정의적식별.재대규모과기기간상진행방법험증,개방성평측결과적정학솔위90.5%、소회솔체78.1%.