计算机工程
計算機工程
계산궤공정
COMPUTER ENGINEERING
2009年
18期
28-30
,共3页
在线话题检测%话题检测与跟踪%文本聚类
在線話題檢測%話題檢測與跟蹤%文本聚類
재선화제검측%화제검측여근종%문본취류
针对互联网新闻报道冗余多、议题发散、易漂移等特点,提出一种面向互联网的在线话题检测算法.该算法针对冗余问题提出子话题概念,针对议题发散问题建立双层检测结构,针对话题漂移问题提出基于滑动窗口的跟踪策略.应用该算法建立网上话题检测系统,通过来源于互联网的真实数据进行测试.结果表明,算法性能优于传统的单路径聚类算法,其最小错误代价率低于0.14.
針對互聯網新聞報道冗餘多、議題髮散、易漂移等特點,提齣一種麵嚮互聯網的在線話題檢測算法.該算法針對冗餘問題提齣子話題概唸,針對議題髮散問題建立雙層檢測結構,針對話題漂移問題提齣基于滑動窗口的跟蹤策略.應用該算法建立網上話題檢測繫統,通過來源于互聯網的真實數據進行測試.結果錶明,算法性能優于傳統的單路徑聚類算法,其最小錯誤代價率低于0.14.
침대호련망신문보도용여다、의제발산、역표이등특점,제출일충면향호련망적재선화제검측산법.해산법침대용여문제제출자화제개념,침대의제발산문제건립쌍층검측결구,침대화제표이문제제출기우활동창구적근종책략.응용해산법건립망상화제검측계통,통과래원우호련망적진실수거진행측시.결과표명,산법성능우우전통적단로경취류산법,기최소착오대개솔저우0.14.