电子与信息学报
電子與信息學報
전자여신식학보
JOURNAL OF ELECTRONICS & INFORMATION TECHNOLOGY
2015年
2期
449-454
,共6页
陈季梦%陈佳俊%刘杰%黄亚楼%王嫄%冯霞
陳季夢%陳佳俊%劉傑%黃亞樓%王嫄%馮霞
진계몽%진가준%류걸%황아루%왕원%풍하
社交网络%有向网络聚类%并行算法%MapReduce
社交網絡%有嚮網絡聚類%併行算法%MapReduce
사교망락%유향망락취류%병행산법%MapReduce
Social networks%Directed network clustering%Parallel algorithm%MapReduce
针对社交网络的有向交互性和大规模特性,该文提出一种基于结构相似度的有向网络聚类算法(DirSCAN),以及相应的分布式并行算法(PDirSCAN)。考虑社交网络中节点间的有向交互性,将行为结构相似的节点聚集起来,并进行节点功能分析。针对社交网络规模巨大的特点,提出MapReduce框架下的分布式并行聚类算法,在确保聚类结果一致的前提下,提高处理性能。大量真实数据集上的实验结果表明,DirSCAN比无向网络聚类算法(SCAN)在F1上可提高2.34%的性能,并行算法PDirSCAN比DirSCAN运行速度提升1.67倍,能够有效处理大规模的有向网络聚类问题。
針對社交網絡的有嚮交互性和大規模特性,該文提齣一種基于結構相似度的有嚮網絡聚類算法(DirSCAN),以及相應的分佈式併行算法(PDirSCAN)。攷慮社交網絡中節點間的有嚮交互性,將行為結構相似的節點聚集起來,併進行節點功能分析。針對社交網絡規模巨大的特點,提齣MapReduce框架下的分佈式併行聚類算法,在確保聚類結果一緻的前提下,提高處理性能。大量真實數據集上的實驗結果錶明,DirSCAN比無嚮網絡聚類算法(SCAN)在F1上可提高2.34%的性能,併行算法PDirSCAN比DirSCAN運行速度提升1.67倍,能夠有效處理大規模的有嚮網絡聚類問題。
침대사교망락적유향교호성화대규모특성,해문제출일충기우결구상사도적유향망락취류산법(DirSCAN),이급상응적분포식병행산법(PDirSCAN)。고필사교망락중절점간적유향교호성,장행위결구상사적절점취집기래,병진행절점공능분석。침대사교망락규모거대적특점,제출MapReduce광가하적분포식병행취류산법,재학보취류결과일치적전제하,제고처이성능。대량진실수거집상적실험결과표명,DirSCAN비무향망락취류산법(SCAN)재F1상가제고2.34%적성능,병행산법PDirSCAN비DirSCAN운행속도제승1.67배,능구유효처리대규모적유향망락취류문제。
To cluster the directed and large-scale social networks, a Structural Clustering Algorithm for Directed Networks (DirSCAN) and a corresponding Parallel algorithm (PDirSCAN) are proposed. Considering oriented behavioral relation between two vertices, DirSCAN is constructed based on action structural similarity and function analysis. To meet the need of large-scale social network analysis, a lossless PDirSCAN based on MapReduce distributed parallel architecture is designed to improve the processing performance. A large number of experimental results on real-world network datasets show that DirSCAN improves performance of SCAN up to 2.34% on F1, PDirSCAN runs 1.67 times faster than DirSCAN.