电子学报
電子學報
전자학보
ACTA ELECTRONICA SINICA
2013年
3期
488-495
,共8页
欧阳柳波%邹北骥%刘丽杰
歐暘柳波%鄒北驥%劉麗傑
구양류파%추북기%류려걸
语料库%领域概念%复合概念%加权词频%词条标签%位置亲和度%复合深度
語料庫%領域概唸%複閤概唸%加權詞頻%詞條標籤%位置親和度%複閤深度
어료고%영역개념%복합개념%가권사빈%사조표첨%위치친화도%복합심도
从大规模领域语料库中抽取领域概念,现有方法不能有效识别复合概念.本文提出一种基于混合判定模型的复合概念抽取方法,首先对文本进行分词处理,为每个词条添加词条标签,并对词条集进行噪音词消除和同义词合并处理,然后统计词条的加权词频,根据词条标签值计算位置亲和度和位置匹配度,判定和筛选可组合成复合概念的原子词条,最后通过设置不同复合深度值,实现多重复合概念抽取.采用不同规模语料库进行抽取实验,实验结果表明本文方法具有更高的召回率和准确率.
從大規模領域語料庫中抽取領域概唸,現有方法不能有效識彆複閤概唸.本文提齣一種基于混閤判定模型的複閤概唸抽取方法,首先對文本進行分詞處理,為每箇詞條添加詞條標籤,併對詞條集進行譟音詞消除和同義詞閤併處理,然後統計詞條的加權詞頻,根據詞條標籤值計算位置親和度和位置匹配度,判定和篩選可組閤成複閤概唸的原子詞條,最後通過設置不同複閤深度值,實現多重複閤概唸抽取.採用不同規模語料庫進行抽取實驗,實驗結果錶明本文方法具有更高的召迴率和準確率.
종대규모영역어료고중추취영역개념,현유방법불능유효식별복합개념.본문제출일충기우혼합판정모형적복합개념추취방법,수선대문본진행분사처리,위매개사조첨가사조표첨,병대사조집진행조음사소제화동의사합병처리,연후통계사조적가권사빈,근거사조표첨치계산위치친화도화위치필배도,판정화사선가조합성복합개념적원자사조,최후통과설치불동복합심도치,실현다중복합개념추취.채용불동규모어료고진행추취실험,실험결과표명본문방법구유경고적소회솔화준학솔.