池州学院学报
池州學院學報
지주학원학보
JOURNAL OF CHIZHOU COLLEGE
2013年
6期
48-50
,共3页
抽取%词汇链%互信息%准确率%召回率
抽取%詞彙鏈%互信息%準確率%召迴率
추취%사회련%호신식%준학솔%소회솔
基于统计的关键词抽取方法忽略了词语的深层语义信息,而词汇链的关键词抽取方法能弥补这一缺陷,但词汇链的构造需要计算语义相似度,而语义相似度的计算需要知识库的支持,提出了一种综合考虑词汇链和互信息模型的关键词抽取算法。首先对文本进行预处理,借助词汇链和互信息模型来表达词语间语义关系,以及对未包含词及相关联度高而相似度值不理想的关键词识别。实验结果表明:在准确率和召回率方面,较基于统计的和基于词汇链的关键词抽取算法均有所提高。
基于統計的關鍵詞抽取方法忽略瞭詞語的深層語義信息,而詞彙鏈的關鍵詞抽取方法能瀰補這一缺陷,但詞彙鏈的構造需要計算語義相似度,而語義相似度的計算需要知識庫的支持,提齣瞭一種綜閤攷慮詞彙鏈和互信息模型的關鍵詞抽取算法。首先對文本進行預處理,藉助詞彙鏈和互信息模型來錶達詞語間語義關繫,以及對未包含詞及相關聯度高而相似度值不理想的關鍵詞識彆。實驗結果錶明:在準確率和召迴率方麵,較基于統計的和基于詞彙鏈的關鍵詞抽取算法均有所提高。
기우통계적관건사추취방법홀략료사어적심층어의신식,이사회련적관건사추취방법능미보저일결함,단사회련적구조수요계산어의상사도,이어의상사도적계산수요지식고적지지,제출료일충종합고필사회련화호신식모형적관건사추취산법。수선대문본진행예처리,차조사회련화호신식모형래표체사어간어의관계,이급대미포함사급상관련도고이상사도치불이상적관건사식별。실험결과표명:재준학솔화소회솔방면,교기우통계적화기우사회련적관건사추취산법균유소제고。