计算机工程
計算機工程
계산궤공정
COMPUTER ENGINEERING
2008年
19期
212-214
,共3页
闵可锐%赵迎宾%刘昕%赵泽宇%闫华
閔可銳%趙迎賓%劉昕%趙澤宇%閆華
민가예%조영빈%류흔%조택우%염화
话题识别与跟踪%信息检索%支持向量机%分类%聚类
話題識彆與跟蹤%信息檢索%支持嚮量機%分類%聚類
화제식별여근종%신식검색%지지향량궤%분류%취류
针对互联网上论坛和新闻网站发布的海量自然语言文本,该文设计一个话题识别与跟踪系统,将海量的数据分类整理并聚合形成各个话题.该系统的核心采用SVM方法进行文本分类,基于知识库和网络流算法实现话题的聚合,测试结果表明,文章分类的正确率达到92%,聚类的正确率达到88%,具有较高的应用价值.
針對互聯網上論罈和新聞網站髮佈的海量自然語言文本,該文設計一箇話題識彆與跟蹤繫統,將海量的數據分類整理併聚閤形成各箇話題.該繫統的覈心採用SVM方法進行文本分類,基于知識庫和網絡流算法實現話題的聚閤,測試結果錶明,文章分類的正確率達到92%,聚類的正確率達到88%,具有較高的應用價值.
침대호련망상론단화신문망참발포적해량자연어언문본,해문설계일개화제식별여근종계통,장해량적수거분류정리병취합형성각개화제.해계통적핵심채용SVM방법진행문본분류,기우지식고화망락류산법실현화제적취합,측시결과표명,문장분류적정학솔체도92%,취류적정학솔체도88%,구유교고적응용개치.