软件学报
軟件學報
연건학보
JOURNAL OF SOFTWARE
2014年
4期
781-796
,共16页
崔颖安%李雪%王志晓%张德运
崔穎安%李雪%王誌曉%張德運
최영안%리설%왕지효%장덕운
在线社会化媒体%大数据%马尔可夫蒙特卡洛方法%多阶段整群抽样
在線社會化媒體%大數據%馬爾可伕矇特卡洛方法%多階段整群抽樣
재선사회화매체%대수거%마이가부몽특잡락방법%다계단정군추양
online social media%big data%Markov chain Monte Carlo%multi stage cluster sampling
在线社会化媒体大数据是行动者自组织关系的集合,其内部蕴含了多层次的社会实体关系,因此,在线社会化媒体大数据抽样方法的研究对于社会计算这一新兴研究领域具有重要的理论和应用价值.现有抽样方法存在大型马尔可夫链难以并行化、样本局部性陷入、马尔可夫链燃烧预热等问题.针对这些问题,提出了在线社会化媒体大数据整群多阶段抽样方法OSM-MSCS.该方法首先进行整群分解,将总体分解成若干小型凝聚子群;而后,使用动态延迟拒绝方法对凝聚子群内部的关系抽样;最后,使用Gibbs方法完成不同凝聚子群之间相干关系的筛选,从而获得整个样本序列.实验结果表明,OSM-MSCS方法能够有效地对各种结构特征的在线社会化媒体大数据进行抽样,从“个体地位-群体凝聚性-整体结构性”这3个层次进行综合评价,其抽样效果要明显好于MHR和BFS这两种最主流的抽样方法.
在線社會化媒體大數據是行動者自組織關繫的集閤,其內部蘊含瞭多層次的社會實體關繫,因此,在線社會化媒體大數據抽樣方法的研究對于社會計算這一新興研究領域具有重要的理論和應用價值.現有抽樣方法存在大型馬爾可伕鏈難以併行化、樣本跼部性陷入、馬爾可伕鏈燃燒預熱等問題.針對這些問題,提齣瞭在線社會化媒體大數據整群多階段抽樣方法OSM-MSCS.該方法首先進行整群分解,將總體分解成若榦小型凝聚子群;而後,使用動態延遲拒絕方法對凝聚子群內部的關繫抽樣;最後,使用Gibbs方法完成不同凝聚子群之間相榦關繫的篩選,從而穫得整箇樣本序列.實驗結果錶明,OSM-MSCS方法能夠有效地對各種結構特徵的在線社會化媒體大數據進行抽樣,從“箇體地位-群體凝聚性-整體結構性”這3箇層次進行綜閤評價,其抽樣效果要明顯好于MHR和BFS這兩種最主流的抽樣方法.
재선사회화매체대수거시행동자자조직관계적집합,기내부온함료다층차적사회실체관계,인차,재선사회화매체대수거추양방법적연구대우사회계산저일신흥연구영역구유중요적이론화응용개치.현유추양방법존재대형마이가부련난이병행화、양본국부성함입、마이가부련연소예열등문제.침대저사문제,제출료재선사회화매체대수거정군다계단추양방법OSM-MSCS.해방법수선진행정군분해,장총체분해성약간소형응취자군;이후,사용동태연지거절방법대응취자군내부적관계추양;최후,사용Gibbs방법완성불동응취자군지간상간관계적사선,종이획득정개양본서렬.실험결과표명,OSM-MSCS방법능구유효지대각충결구특정적재선사회화매체대수거진행추양,종“개체지위-군체응취성-정체결구성”저3개층차진행종합평개,기추양효과요명현호우MHR화BFS저량충최주류적추양방법.