电子与信息学报
電子與信息學報
전자여신식학보
JOURNAL OF ELECTRONICS & INFORMATION TECHNOLOGY
2006年
4期
606-609
,共4页
刘远超%王晓龙%刘秉权%钟彬彬
劉遠超%王曉龍%劉秉權%鐘彬彬
류원초%왕효룡%류병권%종빈빈
文档聚类%关键词抽取%知网%文档相关度
文檔聚類%關鍵詞抽取%知網%文檔相關度
문당취류%관건사추취%지망%문당상관도
信息检索/搜索引擎技术的快速发展使得信息的查全率有较大提高,而查准率以及人们获取信息的效率改善却不明显.文本聚类和多文档关键词的自动生成技术将有助于解决这一问题.其基本思想是对检索到的部分文档进行聚类处理,并对每类文档自动生成关键词,从而帮助用户判断各个类别的文档和检索需求是否相关.该文提出文档相关度和类别相关度的概念,并利用词频信息以及知网(HOWNET)中词的概念计算模型计算类别相关度,将其作为聚类合并的依据.信息获取的仿真实验表明文档检索效率有较大提高.
信息檢索/搜索引擎技術的快速髮展使得信息的查全率有較大提高,而查準率以及人們穫取信息的效率改善卻不明顯.文本聚類和多文檔關鍵詞的自動生成技術將有助于解決這一問題.其基本思想是對檢索到的部分文檔進行聚類處理,併對每類文檔自動生成關鍵詞,從而幫助用戶判斷各箇類彆的文檔和檢索需求是否相關.該文提齣文檔相關度和類彆相關度的概唸,併利用詞頻信息以及知網(HOWNET)中詞的概唸計算模型計算類彆相關度,將其作為聚類閤併的依據.信息穫取的倣真實驗錶明文檔檢索效率有較大提高.
신식검색/수색인경기술적쾌속발전사득신식적사전솔유교대제고,이사준솔이급인문획취신식적효솔개선각불명현.문본취류화다문당관건사적자동생성기술장유조우해결저일문제.기기본사상시대검색도적부분문당진행취류처리,병대매류문당자동생성관건사,종이방조용호판단각개유별적문당화검색수구시부상관.해문제출문당상관도화유별상관도적개념,병이용사빈신식이급지망(HOWNET)중사적개념계산모형계산유별상관도,장기작위취류합병적의거.신식획취적방진실험표명문당검색효솔유교대제고.