计算机研究与发展
計算機研究與髮展
계산궤연구여발전
JOURNAL OF COMPUTER RESEARCH AND DEVELOPMENT
2013年
11期
2336-2348
,共13页
丁兆云%周斌%贾焰%汪祥
丁兆雲%週斌%賈燄%汪祥
정조운%주빈%가염%왕상
垃圾用户%信任传播%三角形统计%微博%社会网络
垃圾用戶%信任傳播%三角形統計%微博%社會網絡
랄급용호%신임전파%삼각형통계%미박%사회망락
spammer%trust propagation%triangle counting%microblog%social networks
传统微博中垃圾用户发现主要依靠用户的显示统计特征,针对微博中关注网络的有向特性,给出了有向网络中局部三角形数量统计算法DirTriangleC,结合用户博文数量和局部三角形比例发现隐式垃圾用户;针对统计特征方法对垃圾用户误报和漏报的缺点,提出了基于统计特征与双向投票算法AttriBiVote,利用用户信任的双向传播与其邻居节点的统计特征共同决定用户类别.真实的Twitter数据集上验证了DirTriangleC和AttriBiVote算法的有效性,结果表明DirTriangleC算法能够发现约83.7%的“完全非活跃”状态的隐式垃圾用户,相对依靠显示统计特征方法增加了约2倍数量的疑似垃圾用户;同时AttriBiVote算法发现垃圾用户的数量和准确性均高于依靠统计特征的垃圾用户发现方法;最后实验分析了AttriBiVote算法的时间开销.
傳統微博中垃圾用戶髮現主要依靠用戶的顯示統計特徵,針對微博中關註網絡的有嚮特性,給齣瞭有嚮網絡中跼部三角形數量統計算法DirTriangleC,結閤用戶博文數量和跼部三角形比例髮現隱式垃圾用戶;針對統計特徵方法對垃圾用戶誤報和漏報的缺點,提齣瞭基于統計特徵與雙嚮投票算法AttriBiVote,利用用戶信任的雙嚮傳播與其鄰居節點的統計特徵共同決定用戶類彆.真實的Twitter數據集上驗證瞭DirTriangleC和AttriBiVote算法的有效性,結果錶明DirTriangleC算法能夠髮現約83.7%的“完全非活躍”狀態的隱式垃圾用戶,相對依靠顯示統計特徵方法增加瞭約2倍數量的疑似垃圾用戶;同時AttriBiVote算法髮現垃圾用戶的數量和準確性均高于依靠統計特徵的垃圾用戶髮現方法;最後實驗分析瞭AttriBiVote算法的時間開銷.
전통미박중랄급용호발현주요의고용호적현시통계특정,침대미박중관주망락적유향특성,급출료유향망락중국부삼각형수량통계산법DirTriangleC,결합용호박문수량화국부삼각형비례발현은식랄급용호;침대통계특정방법대랄급용호오보화루보적결점,제출료기우통계특정여쌍향투표산법AttriBiVote,이용용호신임적쌍향전파여기린거절점적통계특정공동결정용호유별.진실적Twitter수거집상험증료DirTriangleC화AttriBiVote산법적유효성,결과표명DirTriangleC산법능구발현약83.7%적“완전비활약”상태적은식랄급용호,상대의고현시통계특정방법증가료약2배수량적의사랄급용호;동시AttriBiVote산법발현랄급용호적수량화준학성균고우의고통계특정적랄급용호발현방법;최후실험분석료AttriBiVote산법적시간개소.