中文信息学报
中文信息學報
중문신식학보
JOURNAL OF CHINESE INFORMAITON PROCESSING
2011年
3期
9-16
,共8页
游宏梁%张巍%沈钧毅%刘挺
遊宏樑%張巍%瀋鈞毅%劉挺
유굉량%장외%침균의%류정
自动术语识别%投票算法%信息抽取%文本挖掘
自動術語識彆%投票算法%信息抽取%文本挖掘
자동술어식별%투표산법%신식추취%문본알굴
术语自动识别目的是获取领域术语表中未登录的规范化词汇,是信息抽取、文本挖掘等领域中的重要任务.近年来,利用统计方法抽取术语取得了一定进展,出现了C-Value、NC-Value、TermExtractor等有效方法.但是,对各种统计指标进行加权投票的方法研究较少.该文首先从大量已知术语中收集术语的词性模板,并借之抽取候选术语,接着利用了统计指标加权投票对这些候选术语进行排序.在IEEE 2006-2007电子工程领域文献上的实验结果表明,加权投票方法比任一单独指标的识别效果更好.
術語自動識彆目的是穫取領域術語錶中未登錄的規範化詞彙,是信息抽取、文本挖掘等領域中的重要任務.近年來,利用統計方法抽取術語取得瞭一定進展,齣現瞭C-Value、NC-Value、TermExtractor等有效方法.但是,對各種統計指標進行加權投票的方法研究較少.該文首先從大量已知術語中收集術語的詞性模闆,併藉之抽取候選術語,接著利用瞭統計指標加權投票對這些候選術語進行排序.在IEEE 2006-2007電子工程領域文獻上的實驗結果錶明,加權投票方法比任一單獨指標的識彆效果更好.
술어자동식별목적시획취영역술어표중미등록적규범화사회,시신식추취、문본알굴등영역중적중요임무.근년래,이용통계방법추취술어취득료일정진전,출현료C-Value、NC-Value、TermExtractor등유효방법.단시,대각충통계지표진행가권투표적방법연구교소.해문수선종대량이지술어중수집술어적사성모판,병차지추취후선술어,접착이용료통계지표가권투표대저사후선술어진행배서.재IEEE 2006-2007전자공정영역문헌상적실험결과표명,가권투표방법비임일단독지표적식별효과경호.