厦门大学学报(自然科学版)
廈門大學學報(自然科學版)
하문대학학보(자연과학판)
JOURNAL OF XIAMEN UNIVERSITY (NATURAL SCIENCE)
2015年
2期
263-269
,共7页
短语主题%主题抽取%同义词词林%知网
短語主題%主題抽取%同義詞詞林%知網
단어주제%주제추취%동의사사림%지망
phrase subject%subject extraction%synonyms%HowNet
提出了利用主题词存在与否的基于主题词的短语抽取算法,并在其基础上利用社会知识词簇集合作为分类信息,词的相似度作为距离权重,利用改进K最近邻分类算法(KNN)的分类思想,提出基于《知网》词相似度的短语主题抽取算法.并在其基础上提出一种根据中文表达习惯的基于加权主题词的短语主题抽取算法.实验结果表明,后两种算法对短语主题抽取效果良好,平均查全率分别达到78.88%和83.39%,平均查准率达99.06%和99.70%.
提齣瞭利用主題詞存在與否的基于主題詞的短語抽取算法,併在其基礎上利用社會知識詞簇集閤作為分類信息,詞的相似度作為距離權重,利用改進K最近鄰分類算法(KNN)的分類思想,提齣基于《知網》詞相似度的短語主題抽取算法.併在其基礎上提齣一種根據中文錶達習慣的基于加權主題詞的短語主題抽取算法.實驗結果錶明,後兩種算法對短語主題抽取效果良好,平均查全率分彆達到78.88%和83.39%,平均查準率達99.06%和99.70%.
제출료이용주제사존재여부적기우주제사적단어추취산법,병재기기출상이용사회지식사족집합작위분류신식,사적상사도작위거리권중,이용개진K최근린분류산법(KNN)적분류사상,제출기우《지망》사상사도적단어주제추취산법.병재기기출상제출일충근거중문표체습관적기우가권주제사적단어주제추취산법.실험결과표명,후량충산법대단어주제추취효과량호,평균사전솔분별체도78.88%화83.39%,평균사준솔체99.06%화99.70%.