中文信息学报
中文信息學報
중문신식학보
JOURNAL OF CHINESE INFORMAITON PROCESSING
2007年
5期
41-45
,共5页
计算机应用%中文信息处理%PageRank%搜索引擎%Markov状态转移矩阵%矩阵分解
計算機應用%中文信息處理%PageRank%搜索引擎%Markov狀態轉移矩陣%矩陣分解
계산궤응용%중문신식처리%PageRank%수색인경%Markov상태전이구진%구진분해
本文提出了一种基于分解转移矩阵的PageRank的迭代计算方法.该方法对PageRank理论模型进一步推导,把其Markov状态转移矩阵进行了分解,从而降低存储开销和计算复杂度,减少I/O需求,使得PageRank计算的工程化实现更为简单.实验表明1 700多万的网页2.8亿条链接,可以在30秒内完成一次迭代,内存需求峰值585MB,可以满足工程化应用的需求.
本文提齣瞭一種基于分解轉移矩陣的PageRank的迭代計算方法.該方法對PageRank理論模型進一步推導,把其Markov狀態轉移矩陣進行瞭分解,從而降低存儲開銷和計算複雜度,減少I/O需求,使得PageRank計算的工程化實現更為簡單.實驗錶明1 700多萬的網頁2.8億條鏈接,可以在30秒內完成一次迭代,內存需求峰值585MB,可以滿足工程化應用的需求.
본문제출료일충기우분해전이구진적PageRank적질대계산방법.해방법대PageRank이론모형진일보추도,파기Markov상태전이구진진행료분해,종이강저존저개소화계산복잡도,감소I/O수구,사득PageRank계산적공정화실현경위간단.실험표명1 700다만적망혈2.8억조련접,가이재30초내완성일차질대,내존수구봉치585MB,가이만족공정화응용적수구.