宝鸡文理学院学报(自然科学版)
寶鷄文理學院學報(自然科學版)
보계문이학원학보(자연과학판)
JOURNAL OF BAOJI COLLEGE OF ARTS AND SCIENCE (NATURAL SCIENCE)
2014年
1期
51-54
,共4页
微博%爬虫%聚类%舆情
微博%爬蟲%聚類%輿情
미박%파충%취류%여정
目的 自动从新浪微博中抓取含指定关键词的相关微博,通过对抓取的微博进行分析,得到相关舆情热点.方法 首先通过多线程爬虫,自动爬取含有指定关键字的微博,将其保存于数据库中,再采用基于字符串匹配的逆向最大匹配法对微博进行分词,计算各分词项的TF-IDF权重作为文本聚类的输入数据,最后用k-means算法进行聚类分析,得出舆情热点.结果与结论 这种方法能自动从新浪微博中抓取含指定关键词的相关微博,通过聚类分析,每一族的微博内容具有较高的一致性和共同的主题,由此可迅速找出热点舆情,对及时了解和引导舆情具有积极的意义.
目的 自動從新浪微博中抓取含指定關鍵詞的相關微博,通過對抓取的微博進行分析,得到相關輿情熱點.方法 首先通過多線程爬蟲,自動爬取含有指定關鍵字的微博,將其保存于數據庫中,再採用基于字符串匹配的逆嚮最大匹配法對微博進行分詞,計算各分詞項的TF-IDF權重作為文本聚類的輸入數據,最後用k-means算法進行聚類分析,得齣輿情熱點.結果與結論 這種方法能自動從新浪微博中抓取含指定關鍵詞的相關微博,通過聚類分析,每一族的微博內容具有較高的一緻性和共同的主題,由此可迅速找齣熱點輿情,對及時瞭解和引導輿情具有積極的意義.
목적 자동종신랑미박중조취함지정관건사적상관미박,통과대조취적미박진행분석,득도상관여정열점.방법 수선통과다선정파충,자동파취함유지정관건자적미박,장기보존우수거고중,재채용기우자부천필배적역향최대필배법대미박진행분사,계산각분사항적TF-IDF권중작위문본취류적수입수거,최후용k-means산법진행취류분석,득출여정열점.결과여결론 저충방법능자동종신랑미박중조취함지정관건사적상관미박,통과취류분석,매일족적미박내용구유교고적일치성화공동적주제,유차가신속조출열점여정,대급시료해화인도여정구유적겁적의의.