计算机学报
計算機學報
계산궤학보
CHINESE JOURNAL OF COMPUTERS
2014年
8期
1859-1876
,共18页
崔颖安%李雪%王志晓%张德运
崔穎安%李雪%王誌曉%張德運
최영안%리설%왕지효%장덕운
在线社交媒体%社会计算%社交网络%抽样技术%马尔科夫随机行走%抽样评价
在線社交媒體%社會計算%社交網絡%抽樣技術%馬爾科伕隨機行走%抽樣評價
재선사교매체%사회계산%사교망락%추양기술%마이과부수궤행주%추양평개
online social media%social computing%social network%sampling techniques%Markov random walk%sampling evaluation
社交媒体数据是行动者自组织关系的集合,其内部蕴含了多层次的社会实体关系,传统的抽样方法难以处理其内生的复杂性、不确定性以及涌现性,因此社交媒体抽样方法的研究对于社会计算这一新兴研究领域具有重要的研究价值和实践意义.文中首先按照社交媒体抽样技术发展的演进轨迹,对广度优先抽样法、点边抽样法、用户均匀抽样法、同伴推动抽样法以及随机行走抽样法的基本思想、概率化控制能力、应用效果进行了全面的分析和比较,介绍了各类方法的特点与不足.其次根据领域问题研究的需要,使用社交媒体数据对上述方法进行了实际测试.测试结果表明现有抽样方法在微观层次(节点)和中观层次(子群)通过有效的节点规模扩张和概率控制,能够满足节点异质性与子群内聚性抽样的要求,但在宏观层次上却无法准确刻画由于局部凝聚子群再组织所表现出的涌现性.最后以此为依据,指出社交媒体数据抽样未来需要进一步深入研究的问题.
社交媒體數據是行動者自組織關繫的集閤,其內部蘊含瞭多層次的社會實體關繫,傳統的抽樣方法難以處理其內生的複雜性、不確定性以及湧現性,因此社交媒體抽樣方法的研究對于社會計算這一新興研究領域具有重要的研究價值和實踐意義.文中首先按照社交媒體抽樣技術髮展的縯進軌跡,對廣度優先抽樣法、點邊抽樣法、用戶均勻抽樣法、同伴推動抽樣法以及隨機行走抽樣法的基本思想、概率化控製能力、應用效果進行瞭全麵的分析和比較,介紹瞭各類方法的特點與不足.其次根據領域問題研究的需要,使用社交媒體數據對上述方法進行瞭實際測試.測試結果錶明現有抽樣方法在微觀層次(節點)和中觀層次(子群)通過有效的節點規模擴張和概率控製,能夠滿足節點異質性與子群內聚性抽樣的要求,但在宏觀層次上卻無法準確刻畫由于跼部凝聚子群再組織所錶現齣的湧現性.最後以此為依據,指齣社交媒體數據抽樣未來需要進一步深入研究的問題.
사교매체수거시행동자자조직관계적집합,기내부온함료다층차적사회실체관계,전통적추양방법난이처리기내생적복잡성、불학정성이급용현성,인차사교매체추양방법적연구대우사회계산저일신흥연구영역구유중요적연구개치화실천의의.문중수선안조사교매체추양기술발전적연진궤적,대엄도우선추양법、점변추양법、용호균균추양법、동반추동추양법이급수궤행주추양법적기본사상、개솔화공제능력、응용효과진행료전면적분석화비교,개소료각류방법적특점여불족.기차근거영역문제연구적수요,사용사교매체수거대상술방법진행료실제측시.측시결과표명현유추양방법재미관층차(절점)화중관층차(자군)통과유효적절점규모확장화개솔공제,능구만족절점이질성여자군내취성추양적요구,단재굉관층차상각무법준학각화유우국부응취자군재조직소표현출적용현성.최후이차위의거,지출사교매체수거추양미래수요진일보심입연구적문제.