计算机科学
計算機科學
계산궤과학
COMPUTER SCIENCE
2013年
12期
264-269,291
,共7页
同义词词林%语义扩展度%词汇链%关键词提取%语义分析
同義詞詞林%語義擴展度%詞彙鏈%關鍵詞提取%語義分析
동의사사림%어의확전도%사회련%관건사제취%어의분석
Tongyici cilin%Semantic expansion%Lexical chain%Keyword extraction%Semantic analysis
针对影响关键词提取质量的一词多义现象、同义词现象以及文章主题准确全面表达的难点,提出了一种基于语义的关键词提取算法KESELC,利用《同义词词林》语义词典和统计信息计算语义相似度和相关度,进而得出语义扩展度及其计算方法,将语义扩展度和词汇链方法相结合,对文本分别作预处理、多义词词义消歧、同义词合并、词汇链构建、有效特征选取及对权重综合计算的处理,提取出的关键词不仅避免了同义词冗余表达,而且较准确全面地覆盖文本的主题.通过实验对比分析,验证了基于KESELC的方法比基于TFIDF的方法以及基于词汇链的方法具有较优的提取效果,具有一定的实际应用价值.
針對影響關鍵詞提取質量的一詞多義現象、同義詞現象以及文章主題準確全麵錶達的難點,提齣瞭一種基于語義的關鍵詞提取算法KESELC,利用《同義詞詞林》語義詞典和統計信息計算語義相似度和相關度,進而得齣語義擴展度及其計算方法,將語義擴展度和詞彙鏈方法相結閤,對文本分彆作預處理、多義詞詞義消歧、同義詞閤併、詞彙鏈構建、有效特徵選取及對權重綜閤計算的處理,提取齣的關鍵詞不僅避免瞭同義詞冗餘錶達,而且較準確全麵地覆蓋文本的主題.通過實驗對比分析,驗證瞭基于KESELC的方法比基于TFIDF的方法以及基于詞彙鏈的方法具有較優的提取效果,具有一定的實際應用價值.
침대영향관건사제취질량적일사다의현상、동의사현상이급문장주제준학전면표체적난점,제출료일충기우어의적관건사제취산법KESELC,이용《동의사사림》어의사전화통계신식계산어의상사도화상관도,진이득출어의확전도급기계산방법,장어의확전도화사회련방법상결합,대문본분별작예처리、다의사사의소기、동의사합병、사회련구건、유효특정선취급대권중종합계산적처리,제취출적관건사불부피면료동의사용여표체,이차교준학전면지복개문본적주제.통과실험대비분석,험증료기우KESELC적방법비기우TFIDF적방법이급기우사회련적방법구유교우적제취효과,구유일정적실제응용개치.