计算机科学
計算機科學
계산궤과학
COMPUTER SCIENCE
2015年
4期
185-189,198
,共6页
在线社会网络%兴趣分类%LDA%粉丝拓扑
在線社會網絡%興趣分類%LDA%粉絲拓撲
재선사회망락%흥취분류%LDA%분사탁복
Online social networks%User classification%LDA%Topological relation
随着社会的发展,信息已经成为社会发展越来越重要的部分,人类的信息传播活动越来越明显地展示出分众特征,对用户的分类成为人类信息活动的一个重要研究课题.从这一目标出发,分别基于信息内容、拓扑关系和两者综合的方法,按兴趣主题对社会媒体用户进行分类.对于基于信息内容的用户分类,采用LDA主题模型从用户所发布的内容中提取其主题分布,基于这一分布,采用支持向量机、决策树、贝叶斯等多种模型按兴趣主题对用户进行分类.对于基于拓扑关系的分类,依据相同兴趣主题的用户倾向于拥有共同的粉丝这一发现,构建分类模型来按兴趣主题对用户进行分类.然后提出综合信息内容和拓扑关系的分类方法来对用户进行分类.最后基于大规模Twitter数据的实验发现,采用综合方法对用户进行的兴趣分类性能明显高于采用单一信息内容或粉丝拓扑方法的性能.
隨著社會的髮展,信息已經成為社會髮展越來越重要的部分,人類的信息傳播活動越來越明顯地展示齣分衆特徵,對用戶的分類成為人類信息活動的一箇重要研究課題.從這一目標齣髮,分彆基于信息內容、拓撲關繫和兩者綜閤的方法,按興趣主題對社會媒體用戶進行分類.對于基于信息內容的用戶分類,採用LDA主題模型從用戶所髮佈的內容中提取其主題分佈,基于這一分佈,採用支持嚮量機、決策樹、貝葉斯等多種模型按興趣主題對用戶進行分類.對于基于拓撲關繫的分類,依據相同興趣主題的用戶傾嚮于擁有共同的粉絲這一髮現,構建分類模型來按興趣主題對用戶進行分類.然後提齣綜閤信息內容和拓撲關繫的分類方法來對用戶進行分類.最後基于大規模Twitter數據的實驗髮現,採用綜閤方法對用戶進行的興趣分類性能明顯高于採用單一信息內容或粉絲拓撲方法的性能.
수착사회적발전,신식이경성위사회발전월래월중요적부분,인류적신식전파활동월래월명현지전시출분음특정,대용호적분류성위인류신식활동적일개중요연구과제.종저일목표출발,분별기우신식내용、탁복관계화량자종합적방법,안흥취주제대사회매체용호진행분류.대우기우신식내용적용호분류,채용LDA주제모형종용호소발포적내용중제취기주제분포,기우저일분포,채용지지향량궤、결책수、패협사등다충모형안흥취주제대용호진행분류.대우기우탁복관계적분류,의거상동흥취주제적용호경향우옹유공동적분사저일발현,구건분류모형래안흥취주제대용호진행분류.연후제출종합신식내용화탁복관계적분류방법래대용호진행분류.최후기우대규모Twitter수거적실험발현,채용종합방법대용호진행적흥취분류성능명현고우채용단일신식내용혹분사탁복방법적성능.