洛阳师范学院学报
洛暘師範學院學報
락양사범학원학보
Journal of Luoyang Teachers College
2012年
11期
60~64
,共null页
热点主题识别 热点挖掘 特征选取 微博
熱點主題識彆 熱點挖掘 特徵選取 微博
열점주제식별 열점알굴 특정선취 미박
topic detection; hot topic mining; feature selection; microblog
提出了潜在狄利赫雷分布模型与自然语言信息处理相关技术相结合的一种挖掘Twitter中中文微博的热点主题词组的方法.选取了20923条中文Tweets作为样本,获取了相关热点的主题词组,与预期的效果基本吻合,表明该模型具有较好的热点识别效果和对主题进行描述的能力.
提齣瞭潛在狄利赫雷分佈模型與自然語言信息處理相關技術相結閤的一種挖掘Twitter中中文微博的熱點主題詞組的方法.選取瞭20923條中文Tweets作為樣本,穫取瞭相關熱點的主題詞組,與預期的效果基本吻閤,錶明該模型具有較好的熱點識彆效果和對主題進行描述的能力.
제출료잠재적리혁뢰분포모형여자연어언신식처리상관기술상결합적일충알굴Twitter중중문미박적열점주제사조적방법.선취료20923조중문Tweets작위양본,획취료상관열점적주제사조,여예기적효과기본문합,표명해모형구유교호적열점식별효과화대주제진행묘술적능력.
This paper proposes a method that combines LDA model and related techniques of the natural language information processing in a bid to extract hot topic phrases in Chinese microblogs in Twitter.To corroborate the effectiveness of this method,this paper selects 20,923 pieces of Chinese Tweets as samples.The extracted topic phrases are generally within expectation,demonstrating that this model is capable of recognizing hot topics and describing them.