科技通报
科技通報
과기통보
BULLETIN OF SCIENCE AND TECHNOLOGY
2013年
9期
137-141
,共5页
用户迁徙网络%网络爬虫%网络属性
用戶遷徙網絡%網絡爬蟲%網絡屬性
용호천사망락%망락파충%망락속성
user-migration network%network crawler%network property
在传统的互联网中,往往是由节点表示网站,节点之间的边表示两个网站之间有物理链接。由于直观的反应了网络状态,这种网络模型得到了广泛的应用。但当研究一些基于网络的高级应用如探讨用户访问网络、在各网站间的分布情况时,传统的互联网有其局限性。本文尝试研究不同网站之间的共同用户如何进行“网络迁徙”。我们使用爬虫搜集网络中的信息,构建了一个“用户迁徙”网络:网络中的节点代表网站,两个节点之间有边表示在一段时间内这两个网站有相同的用户访问,节点之间的权值代表了一段时间内可能访问这两个网站的共同用户的数量。这种用户迁徙网络不仅可以使我们了解互联网中用户的兴趣分布,而且还可以作为研究平台广泛应用于搜索或者网络广告投放研究等方面。
在傳統的互聯網中,往往是由節點錶示網站,節點之間的邊錶示兩箇網站之間有物理鏈接。由于直觀的反應瞭網絡狀態,這種網絡模型得到瞭廣汎的應用。但噹研究一些基于網絡的高級應用如探討用戶訪問網絡、在各網站間的分佈情況時,傳統的互聯網有其跼限性。本文嘗試研究不同網站之間的共同用戶如何進行“網絡遷徙”。我們使用爬蟲搜集網絡中的信息,構建瞭一箇“用戶遷徙”網絡:網絡中的節點代錶網站,兩箇節點之間有邊錶示在一段時間內這兩箇網站有相同的用戶訪問,節點之間的權值代錶瞭一段時間內可能訪問這兩箇網站的共同用戶的數量。這種用戶遷徙網絡不僅可以使我們瞭解互聯網中用戶的興趣分佈,而且還可以作為研究平檯廣汎應用于搜索或者網絡廣告投放研究等方麵。
재전통적호련망중,왕왕시유절점표시망참,절점지간적변표시량개망참지간유물리련접。유우직관적반응료망락상태,저충망락모형득도료엄범적응용。단당연구일사기우망락적고급응용여탐토용호방문망락、재각망참간적분포정황시,전통적호련망유기국한성。본문상시연구불동망참지간적공동용호여하진행“망락천사”。아문사용파충수집망락중적신식,구건료일개“용호천사”망락:망락중적절점대표망참,량개절점지간유변표시재일단시간내저량개망참유상동적용호방문,절점지간적권치대표료일단시간내가능방문저량개망참적공동용호적수량。저충용호천사망락불부가이사아문료해호련망중용호적흥취분포,이차환가이작위연구평태엄범응용우수색혹자망락엄고투방연구등방면。
In The World Wide Web where nodes are websites and the link of websites means there lies a physical connect. This network structure has widely application for it’s direct reflection of the reality. But it has its own limited when understanding how crowds’interests collectively spread on the Web. In this paper, we design a crawler which gather the information about the affinities among website to form a user-migration network. In this network, he nodes are websites and the weight of a link that connects two nodes corresponds to the average number of users that visits both of the websites over longer timescale. Using this user-migration network is useful for applications such as advertising of search.