计算机研究与发展
計算機研究與髮展
계산궤연구여발전
JOURNAL OF COMPUTER RESEARCH AND DEVELOPMENT
2014年
1期
206-214
,共9页
李贵林%杨禹琪%高星%廖明宏
李貴林%楊禹琪%高星%廖明宏
리귀림%양우기%고성%료명굉
本地文档集%个性化%结果排序%模糊推理%抽样%企业搜索引擎
本地文檔集%箇性化%結果排序%模糊推理%抽樣%企業搜索引擎
본지문당집%개성화%결과배서%모호추리%추양%기업수색인경
local document set%personalization%rank%fuzzy inference%sampling%enterprise search engine
针对企业搜索引擎提出一种基于本地文档库的个性化表示与结果排序算法,以帮助用户找到真正感兴趣的结果.首先,采用聚类分析对用户浏览的历史文档聚类;其次,采用模糊推理技术对所形成的分类进行分析,发现用户对各分类的喜好程度;再次,按用户对各分类喜好程度的不同,为各分类分配抽样文档数;最后,采用多种抽样技术,从各分类中抽取典型文档.来自不同分类的典型文档构成了表示用户个性的本地文档库.结果排序算法通过计算通用企业搜索引擎的搜索结果与本地文档库中各文档的相似性,对结果集重新排序,从而体现出用户个性.实验结果表明,与传统的基于关键词的个性化表示与结果排序算法相比,基于本地文档集的个性化表示与结果排序算法可以给出更能反映用户个性的查询结果,且可以对用户偏好的变化作出更迅速的反映.
針對企業搜索引擎提齣一種基于本地文檔庫的箇性化錶示與結果排序算法,以幫助用戶找到真正感興趣的結果.首先,採用聚類分析對用戶瀏覽的歷史文檔聚類;其次,採用模糊推理技術對所形成的分類進行分析,髮現用戶對各分類的喜好程度;再次,按用戶對各分類喜好程度的不同,為各分類分配抽樣文檔數;最後,採用多種抽樣技術,從各分類中抽取典型文檔.來自不同分類的典型文檔構成瞭錶示用戶箇性的本地文檔庫.結果排序算法通過計算通用企業搜索引擎的搜索結果與本地文檔庫中各文檔的相似性,對結果集重新排序,從而體現齣用戶箇性.實驗結果錶明,與傳統的基于關鍵詞的箇性化錶示與結果排序算法相比,基于本地文檔集的箇性化錶示與結果排序算法可以給齣更能反映用戶箇性的查詢結果,且可以對用戶偏好的變化作齣更迅速的反映.
침대기업수색인경제출일충기우본지문당고적개성화표시여결과배서산법,이방조용호조도진정감흥취적결과.수선,채용취류분석대용호류람적역사문당취류;기차,채용모호추리기술대소형성적분류진행분석,발현용호대각분류적희호정도;재차,안용호대각분류희호정도적불동,위각분류분배추양문당수;최후,채용다충추양기술,종각분류중추취전형문당.래자불동분류적전형문당구성료표시용호개성적본지문당고.결과배서산법통과계산통용기업수색인경적수색결과여본지문당고중각문당적상사성,대결과집중신배서,종이체현출용호개성.실험결과표명,여전통적기우관건사적개성화표시여결과배서산법상비,기우본지문당집적개성화표시여결과배서산법가이급출경능반영용호개성적사순결과,차가이대용호편호적변화작출경신속적반영.