计算机研究与发展
計算機研究與髮展
계산궤연구여발전
JOURNAL OF COMPUTER RESEARCH AND DEVELOPMENT
2007年
z2期
135-139
,共5页
搜索结果聚类%词汇图%同义词%文档相似度
搜索結果聚類%詞彙圖%同義詞%文檔相似度
수색결과취류%사회도%동의사%문당상사도
将查询结果根据其内容进行聚类是提高搜索引擎服务质量的关键技术之一.搜索结果聚类时只能从文档标题和文档片段中抽取有限信息,传统聚类方法难以准确计算其相似度.提出了一种基于词汇图的搜索结果聚类算法,以词作为聚类的核心依据,定义了以词为顶点、文档为词的属性、词间相关度为边的词汇图,并以词汇图为依据进行文档类别划分.充分利用了词间的关联信息,增强了同义词的扩展能力,划分后即可确定类别名.实验结果表明,进行搜索结果聚类时与传统算法相比质量上有所提高.
將查詢結果根據其內容進行聚類是提高搜索引擎服務質量的關鍵技術之一.搜索結果聚類時隻能從文檔標題和文檔片段中抽取有限信息,傳統聚類方法難以準確計算其相似度.提齣瞭一種基于詞彙圖的搜索結果聚類算法,以詞作為聚類的覈心依據,定義瞭以詞為頂點、文檔為詞的屬性、詞間相關度為邊的詞彙圖,併以詞彙圖為依據進行文檔類彆劃分.充分利用瞭詞間的關聯信息,增彊瞭同義詞的擴展能力,劃分後即可確定類彆名.實驗結果錶明,進行搜索結果聚類時與傳統算法相比質量上有所提高.
장사순결과근거기내용진행취류시제고수색인경복무질량적관건기술지일.수색결과취류시지능종문당표제화문당편단중추취유한신식,전통취류방법난이준학계산기상사도.제출료일충기우사회도적수색결과취류산법,이사작위취류적핵심의거,정의료이사위정점、문당위사적속성、사간상관도위변적사회도,병이사회도위의거진행문당유별화분.충분이용료사간적관련신식,증강료동의사적확전능력,화분후즉가학정유별명.실험결과표명,진행수색결과취류시여전통산법상비질량상유소제고.