情报学报
情報學報
정보학보
2011年
12期
1280-1285
,共6页
术语抽取%技术术语%术语度%专利分析
術語抽取%技術術語%術語度%專利分析
술어추취%기술술어%술어도%전리분석
针对专利中缺少技术关键词的问题,在对主要的术语抽取方法研究的基础上,引入C-value方法,修改了术语构词规则和术语度(termhood)计算公式,用PC-value值测量一个词语的术语度,提出了专利技术术语抽取的流程模型,实现了从专利中抽取技术术语.该模型分为四个阶段:①分词和词性标注; ②运用语言学规则取得可能术语列表; ③计算词语的术语度值,取得候选术语列表; ④领域专家评估并确定术语.实验结果证明,提出的方法能很好地抽取中文专利技术术语,在长术语的抽取和抽取精度上比C-value方法更具有优势.
針對專利中缺少技術關鍵詞的問題,在對主要的術語抽取方法研究的基礎上,引入C-value方法,脩改瞭術語構詞規則和術語度(termhood)計算公式,用PC-value值測量一箇詞語的術語度,提齣瞭專利技術術語抽取的流程模型,實現瞭從專利中抽取技術術語.該模型分為四箇階段:①分詞和詞性標註; ②運用語言學規則取得可能術語列錶; ③計算詞語的術語度值,取得候選術語列錶; ④領域專傢評估併確定術語.實驗結果證明,提齣的方法能很好地抽取中文專利技術術語,在長術語的抽取和抽取精度上比C-value方法更具有優勢.
침대전리중결소기술관건사적문제,재대주요적술어추취방법연구적기출상,인입C-value방법,수개료술어구사규칙화술어도(termhood)계산공식,용PC-value치측량일개사어적술어도,제출료전리기술술어추취적류정모형,실현료종전리중추취기술술어.해모형분위사개계단:①분사화사성표주; ②운용어언학규칙취득가능술어렬표; ③계산사어적술어도치,취득후선술어렬표; ④영역전가평고병학정술어.실험결과증명,제출적방법능흔호지추취중문전리기술술어,재장술어적추취화추취정도상비C-value방법경구유우세.