软件
軟件
연건
SOFT WARE
2012年
6期
51-53
,共3页
元搜索%相似度%去重%排序
元搜索%相似度%去重%排序
원수색%상사도%거중%배서
结果去重和排序是提高元搜索引擎结果质量的两个关键问题,文章分析余弦相似度、基于TF-IDF的文本相似度三种去重算法,利用URL、标题和计算摘要相似度三方面去重;研究了Board排序、星星排序、轮询法、位置排序和概念可行度对检索结果的影响,提出了一种综合排序算法.实验结果表明,综合排序算法在准确率、召回率等方面都优于其他算法.
結果去重和排序是提高元搜索引擎結果質量的兩箇關鍵問題,文章分析餘絃相似度、基于TF-IDF的文本相似度三種去重算法,利用URL、標題和計算摘要相似度三方麵去重;研究瞭Board排序、星星排序、輪詢法、位置排序和概唸可行度對檢索結果的影響,提齣瞭一種綜閤排序算法.實驗結果錶明,綜閤排序算法在準確率、召迴率等方麵都優于其他算法.
결과거중화배서시제고원수색인경결과질량적량개관건문제,문장분석여현상사도、기우TF-IDF적문본상사도삼충거중산법,이용URL、표제화계산적요상사도삼방면거중;연구료Board배서、성성배서、륜순법、위치배서화개념가행도대검색결과적영향,제출료일충종합배서산법.실험결과표명,종합배서산법재준학솔、소회솔등방면도우우기타산법.