计算机学报
計算機學報
계산궤학보
CHINESE JOURNAL OF COMPUTERS
2014年
4期
767-778
,共12页
微博%复杂网络%双段幂律%双帕累托对数正态分布%对数正态分布%社交网络%社会计算
微博%複雜網絡%雙段冪律%雙帕纍託對數正態分佈%對數正態分佈%社交網絡%社會計算
미박%복잡망락%쌍단멱률%쌍파루탁대수정태분포%대수정태분포%사교망락%사회계산
microblog%complex network%double power-law%double pareto lognormal%lognormal%social network%social computing
根据新浪微博的实际用户数据,发现粉丝数、关注数和微博数3个特征量的分布,都存在双段幂律分布现象,不同类型用户特征量的分布具有差异性。使用双帕累托对数正态(DPLN)分布对数据进行拟合,相比对数正态分布和幂律分布,可以得到更优的效果。用户活跃时间服从指数分布,不同活跃时间的3个用户特征量都近似服从对数正态分布;用户特征量的增长率服从对数正态分布,且与特征量自身的规模无关,这些特征与双帕累托对数正态分布模型一致,从而使用这一模型可以很好地解释粉丝数、关注数和微博数分布特性的形成机制。
根據新浪微博的實際用戶數據,髮現粉絲數、關註數和微博數3箇特徵量的分佈,都存在雙段冪律分佈現象,不同類型用戶特徵量的分佈具有差異性。使用雙帕纍託對數正態(DPLN)分佈對數據進行擬閤,相比對數正態分佈和冪律分佈,可以得到更優的效果。用戶活躍時間服從指數分佈,不同活躍時間的3箇用戶特徵量都近似服從對數正態分佈;用戶特徵量的增長率服從對數正態分佈,且與特徵量自身的規模無關,這些特徵與雙帕纍託對數正態分佈模型一緻,從而使用這一模型可以很好地解釋粉絲數、關註數和微博數分佈特性的形成機製。
근거신랑미박적실제용호수거,발현분사수、관주수화미박수3개특정량적분포,도존재쌍단멱률분포현상,불동류형용호특정량적분포구유차이성。사용쌍파루탁대수정태(DPLN)분포대수거진행의합,상비대수정태분포화멱률분포,가이득도경우적효과。용호활약시간복종지수분포,불동활약시간적3개용호특정량도근사복종대수정태분포;용호특정량적증장솔복종대수정태분포,차여특정량자신적규모무관,저사특정여쌍파루탁대수정태분포모형일치,종이사용저일모형가이흔호지해석분사수、관주수화미박수분포특성적형성궤제。
Based on the actual data from Sina Weibo,this paper mainly discusses the distributionof three users’characteristics—the number of followers,friends,and statuses.They are subjectto the double power-law distribution and different types of users with various features.It is foundthat the double Pareto lognormal (DPLN)distribution can better fit the overall distribution ofuser’s three characteristics than the lognormal distribution and power-law distribution.Moreover,the user activity span is found to be exponentially distributed,and the number of these three usercharacteristics approximately follows the lognormal distribution in the different active spans.Furthermore,it is observed that these users’characteristics growth rates follow lognormal distri-bution and are independent with users’characteristics.This phenomenon is consistent with thedouble Pareto lognormal distribution model.These new findings could help explain the formationmechanism of the number of followers,friends and statuses in microblog.