情报杂志
情報雜誌
정보잡지
JOURNAL OF INFORMATION
2014年
1期
91-96
,共6页
周鹏%蔡淑琴%石双元%王伟
週鵬%蔡淑琴%石雙元%王偉
주붕%채숙금%석쌍원%왕위
微博%舆情事件%文本挖掘%抽取%KEA算法%朴素贝叶斯模型
微博%輿情事件%文本挖掘%抽取%KEA算法%樸素貝葉斯模型
미박%여정사건%문본알굴%추취%KEA산법%박소패협사모형
microblogging%public opinion events%text mining%keyword extraction%KEA algorithm%navie bayesian model
微博舆情事件会带来严重后果,而碎片化和无序化使得难以从海量的微博内容中全面地认知微博舆情事件的全貌。从微博舆情事件内容聚合出其主要内容具有重要实践价值和研究价值。基于关键词抽取技术KEA提出了一种微博舆情事件内容聚合方法。根据对微博内容篇幅、规范性和网络性的分析,增加中心度特征、词性特征和改进词位置特征,并以朴素贝叶斯分类器抽取关键词集作为聚合输出。最后通过现实微博平台上的内容聚合实验证明本研究所提方法相对基线方法在准确率和召回率上的优势。
微博輿情事件會帶來嚴重後果,而碎片化和無序化使得難以從海量的微博內容中全麵地認知微博輿情事件的全貌。從微博輿情事件內容聚閤齣其主要內容具有重要實踐價值和研究價值。基于關鍵詞抽取技術KEA提齣瞭一種微博輿情事件內容聚閤方法。根據對微博內容篇幅、規範性和網絡性的分析,增加中心度特徵、詞性特徵和改進詞位置特徵,併以樸素貝葉斯分類器抽取關鍵詞集作為聚閤輸齣。最後通過現實微博平檯上的內容聚閤實驗證明本研究所提方法相對基線方法在準確率和召迴率上的優勢。
미박여정사건회대래엄중후과,이쇄편화화무서화사득난이종해량적미박내용중전면지인지미박여정사건적전모。종미박여정사건내용취합출기주요내용구유중요실천개치화연구개치。기우관건사추취기술KEA제출료일충미박여정사건내용취합방법。근거대미박내용편폭、규범성화망락성적분석,증가중심도특정、사성특정화개진사위치특정,병이박소패협사분류기추취관건사집작위취합수출。최후통과현실미박평태상적내용취합실험증명본연구소제방법상대기선방법재준학솔화소회솔상적우세。
Microblogging public opinion events(MPOE) bring serious consequences, it's difficult to recognize the full view of MPOE from huge number of microblogging content for its fragmentation and disordering. Aggregating main point from MPOE is of important practical value and research value. Based on KEA, the keyword automatic extraction, the paper proposes a method to aggregate main point from MPOE. According to the length distribution, normative and network characteristic, the paper adds centrality feature, part-of-speech feature and modifies the position feature, then extracts the keywords as output of MPOE aggregation by Na?ve-Bayes classifier. Finally, advantage on precision and recall of method we proposed comparing with baseline method is proved by experiment of MPOE aggregation performed on real microblogging platform.