计算机学报
計算機學報
계산궤학보
CHINESE JOURNAL OF COMPUTERS
2014年
4期
819-832
,共14页
赵旭剑%杨春明%李波%张晖%金培权%岳丽华%戴文锴
趙旭劍%楊春明%李波%張暉%金培權%嶽麗華%戴文鍇
조욱검%양춘명%리파%장휘%금배권%악려화%대문개
话题演化%话题模型%演变特征%演化偏斜%社会计算%社交网络
話題縯化%話題模型%縯變特徵%縯化偏斜%社會計算%社交網絡
화제연화%화제모형%연변특정%연화편사%사회계산%사교망락
topic evolution%topic model%evolution feature%evolution deviation%social computing%social network
话题演化挖掘研究可以准确完整地获取新闻话题动态演化各个阶段的话题内容,帮助用户理解新闻话题的来龙去脉以及话题内容之间的相关性和差异性,因此在网络新闻检索、网络舆情监控、互联网突发事件检测与应急管理等方面具有十分重要的作用和应用前景。现有工作由于缺乏对话题特征随时间发展而动态演变的深入分析,仅仅采用均值泛化的思想去增量扩充演化中的话题特征,引入大量话题无关信息,影响了话题关联的准确率,从而导致最终话题演化挖掘结果的偏斜。因此,针对以上问题,文中通过引入话题特征演变特性,提出一种针对话题演化的特征计算模型,在此基础上利用已有话题相关文档和最新文档进行话题信息动态增量扩充,通过对话题特征进行正向融合以及逆向过滤完成对特征信息的抗噪处理,提高话题关联的正确率,有效地解决了话题演化的偏斜问题。
話題縯化挖掘研究可以準確完整地穫取新聞話題動態縯化各箇階段的話題內容,幫助用戶理解新聞話題的來龍去脈以及話題內容之間的相關性和差異性,因此在網絡新聞檢索、網絡輿情鑑控、互聯網突髮事件檢測與應急管理等方麵具有十分重要的作用和應用前景。現有工作由于缺乏對話題特徵隨時間髮展而動態縯變的深入分析,僅僅採用均值汎化的思想去增量擴充縯化中的話題特徵,引入大量話題無關信息,影響瞭話題關聯的準確率,從而導緻最終話題縯化挖掘結果的偏斜。因此,針對以上問題,文中通過引入話題特徵縯變特性,提齣一種針對話題縯化的特徵計算模型,在此基礎上利用已有話題相關文檔和最新文檔進行話題信息動態增量擴充,通過對話題特徵進行正嚮融閤以及逆嚮過濾完成對特徵信息的抗譟處理,提高話題關聯的正確率,有效地解決瞭話題縯化的偏斜問題。
화제연화알굴연구가이준학완정지획취신문화제동태연화각개계단적화제내용,방조용호리해신문화제적래룡거맥이급화제내용지간적상관성화차이성,인차재망락신문검색、망락여정감공、호련망돌발사건검측여응급관리등방면구유십분중요적작용화응용전경。현유공작유우결핍대화제특정수시간발전이동태연변적심입분석,부부채용균치범화적사상거증량확충연화중적화제특정,인입대량화제무관신식,영향료화제관련적준학솔,종이도치최종화제연화알굴결과적편사。인차,침대이상문제,문중통과인입화제특정연변특성,제출일충침대화제연화적특정계산모형,재차기출상이용이유화제상관문당화최신문당진행화제신식동태증량확충,통과대화제특정진행정향융합이급역향과려완성대특정신식적항조처리,제고화제관련적정학솔,유효지해결료화제연화적편사문제。
The research on the topic evolution mining can obtain the topic information accuratelyand completely at all topic episodes,which is able to help users understand the cause and effect aswell as the correlation and difference of news topic.Thus,it has a very important role in WebNews Search,Network Public Opinion Monitoring,Internet Incident Detection and EmergencyManagement,etc.Owning to lacking the in-depth analysis of the dynamic evolution of topicfeatures over time in the existing work which only uses the mean generalization thought to extendtopic features in the evolution process incrementally,a large number of irrelevant topic information isintroduced into the current work.Meanwhile the low accuracy of the topic associated computationproduced by current work leads to the deviation phenomena of the topic evolution mining.Aimingto deal with this issue,this paper first proposes a feature computation model of the topic-evolution-oriented through introducing the evolution characteristics of the topic feature,and then on this basis,the article conducts the forward fusion and reverse filter under the existing topic-relatedstories and newly arrived stories in order to fulfill the incremental expansion of topic informationand anti-noise processing.The experiment results show that this method improves the topicassociation precision and solve the topic evolution deviation problem effectively.