计算机工程与设计
計算機工程與設計
계산궤공정여설계
COMPUTER ENGINEERING AND DESIGN
2010年
8期
1678-1681
,共4页
搜索引擎%页面排序%词项权重%链接分析%用户偏好
搜索引擎%頁麵排序%詞項權重%鏈接分析%用戶偏好
수색인경%혈면배서%사항권중%련접분석%용호편호
search engine%page ranking%term weighting%link analysis%user preferences
针对PageRank算法不十分关注页面内容而只关注"超链分析"的现状,并存在着用户实际所需要的页面的次序并不靠前的问题,提出了一种搜索引擎页面排序融合算法.该算法通过考虑词项权重、链接分析和用户偏好3个主要方面,得到一个URL的权值评价,这样每个待搜集的网页都有自己的权值评价,超链选择程序根据这些权值,从中选出一个或一批权值最大的来搜集,以达到精确检索的目的.
針對PageRank算法不十分關註頁麵內容而隻關註"超鏈分析"的現狀,併存在著用戶實際所需要的頁麵的次序併不靠前的問題,提齣瞭一種搜索引擎頁麵排序融閤算法.該算法通過攷慮詞項權重、鏈接分析和用戶偏好3箇主要方麵,得到一箇URL的權值評價,這樣每箇待搜集的網頁都有自己的權值評價,超鏈選擇程序根據這些權值,從中選齣一箇或一批權值最大的來搜集,以達到精確檢索的目的.
침대PageRank산법불십분관주혈면내용이지관주"초련분석"적현상,병존재착용호실제소수요적혈면적차서병불고전적문제,제출료일충수색인경혈면배서융합산법.해산법통과고필사항권중、련접분석화용호편호3개주요방면,득도일개URL적권치평개,저양매개대수집적망혈도유자기적권치평개,초련선택정서근거저사권치,종중선출일개혹일비권치최대적래수집,이체도정학검색적목적.
PageRank algorithm is not very concerned about the content page,only concerns about "Hyperlink analysis",and the existence of the actual needs of the user page is not high priority issues.A page ranking fusion algorithm of search engine is presented.By taking into account term weighting,link analysis and user preferences in three main areas,the algorithm got a URL value evaluation.To be collected so that each page has its own weight of evaluation,hyperlink selection process based on these weights,choosed one or a group of the largest weight to the collection,in order to achieve the purpose of precise retrieval.