计算机工程
計算機工程
계산궤공정
COMPUTER ENGINEERING
2014年
5期
1-6,11
,共7页
主题模型%潜在狄利克雷分配%微博%用户模型%兴趣分析%用户推荐
主題模型%潛在狄利剋雷分配%微博%用戶模型%興趣分析%用戶推薦
주제모형%잠재적리극뢰분배%미박%용호모형%흥취분석%용호추천
topic model%Latent Dirichlet Allocation(LDA)%microblog%user model%interest analysis%user recommendation
潜在狄利克雷分配(LDA)主题模型可用于识别大规模文档集中潜藏的主题信息,但是对于微博短文本的应用效果并不理想。为此,提出一种基于LDA的微博用户模型,将微博基于用户进行划分,合并每个用户发布的微博以代表用户,标准的文档-主题-词的三层LDA模型变为用户-主题-词的用户模型,利用该模型进行用户推荐。在真实微博数据集上的实验结果表明,与传统的向量空间模型方法相比,采用该方法进行用户推荐具有更好的效果,在选择合适的主题数情况下,其准确率提高近10%。
潛在狄利剋雷分配(LDA)主題模型可用于識彆大規模文檔集中潛藏的主題信息,但是對于微博短文本的應用效果併不理想。為此,提齣一種基于LDA的微博用戶模型,將微博基于用戶進行劃分,閤併每箇用戶髮佈的微博以代錶用戶,標準的文檔-主題-詞的三層LDA模型變為用戶-主題-詞的用戶模型,利用該模型進行用戶推薦。在真實微博數據集上的實驗結果錶明,與傳統的嚮量空間模型方法相比,採用該方法進行用戶推薦具有更好的效果,在選擇閤適的主題數情況下,其準確率提高近10%。
잠재적리극뢰분배(LDA)주제모형가용우식별대규모문당집중잠장적주제신식,단시대우미박단문본적응용효과병불이상。위차,제출일충기우LDA적미박용호모형,장미박기우용호진행화분,합병매개용호발포적미박이대표용호,표준적문당-주제-사적삼층LDA모형변위용호-주제-사적용호모형,이용해모형진행용호추천。재진실미박수거집상적실험결과표명,여전통적향량공간모형방법상비,채용해방법진행용호추천구유경호적효과,재선택합괄적주제수정황하,기준학솔제고근10%。
Latent Dirichlet Allocation(LDA) model can be used for identifying topic information from large-scale document set, but the effect is not ideal for short text such as microblog. This paper proposes a microblog user model based on LDA, which divides microblog based on user and represents each user with their posted microbolgs. Thus, the standard three layers in LDA model by document-topic-word becomes a user model by user-topic-word. The model is applied to user recommendation. Experiment on real data set shows that the new provided method has a better effect. With a proper topic number, the performance is improved by nearly 10%.