甘肃科技纵横
甘肅科技縱橫
감숙과기종횡
SCIENTIFIC & TECHNICAL INFORMATION OF GANSU
2011年
6期
17-19
,共3页
韩小斌%于洪志%曹晖
韓小斌%于洪誌%曹暉
한소빈%우홍지%조휘
话题发现%凝聚聚类%Single—pass聚类%热度计算
話題髮現%凝聚聚類%Single—pass聚類%熱度計算
화제발현%응취취류%Single—pass취류%열도계산
针对互联网上新闻网站和论坛、博客等发布的海量自然语言文本,本文设计了一个面向藏文的话题发现系统,将大量藏语文本分类整理并聚合成各个话题。本文采用两层聚类策略对文本进行聚类,实验结果表明文本聚类取得了不错的结果,具有较高的应用价值。
針對互聯網上新聞網站和論罈、博客等髮佈的海量自然語言文本,本文設計瞭一箇麵嚮藏文的話題髮現繫統,將大量藏語文本分類整理併聚閤成各箇話題。本文採用兩層聚類策略對文本進行聚類,實驗結果錶明文本聚類取得瞭不錯的結果,具有較高的應用價值。
침대호련망상신문망참화론단、박객등발포적해량자연어언문본,본문설계료일개면향장문적화제발현계통,장대량장어문본분류정리병취합성각개화제。본문채용량층취류책략대문본진행취류,실험결과표명문본취류취득료불착적결과,구유교고적응용개치。