数字技术与应用
數字技術與應用
수자기술여응용
Digital Technology and Application
2015年
10期
81
,共1页
微博挖掘%信息抽取%模式识别
微博挖掘%信息抽取%模式識彆
미박알굴%신식추취%모식식별
微博(MicroBlog)作为新型社交媒体积累了各领域的海量数据,对这些数据的分析将会带来很大的社会和商业价值.但由于微博的产品特点使得对其的话题识别方法不同于以往的传统文本.本文针对微博的特点,提出使用LDA模型对微博海量数据中的隐含话题进行建模,解决发散性带来的高维问题.实验结果表明,该方法能够获得较准确的微博话题识别结果.
微博(MicroBlog)作為新型社交媒體積纍瞭各領域的海量數據,對這些數據的分析將會帶來很大的社會和商業價值.但由于微博的產品特點使得對其的話題識彆方法不同于以往的傳統文本.本文針對微博的特點,提齣使用LDA模型對微博海量數據中的隱含話題進行建模,解決髮散性帶來的高維問題.實驗結果錶明,該方法能夠穫得較準確的微博話題識彆結果.
미박(MicroBlog)작위신형사교매체적루료각영역적해량수거,대저사수거적분석장회대래흔대적사회화상업개치.단유우미박적산품특점사득대기적화제식별방법불동우이왕적전통문본.본문침대미박적특점,제출사용LDA모형대미박해량수거중적은함화제진행건모,해결발산성대래적고유문제.실험결과표명,해방법능구획득교준학적미박화제식별결과.