通讯世界
通訊世界
통신세계
TELECOM WORLD
2015年
11期
312-312,313
,共2页
赵旭剑%冯健%李波%张晖%王耀彬
趙旭劍%馮健%李波%張暉%王耀彬
조욱검%풍건%리파%장휘%왕요빈
文本话题%HAC%层次聚类%特征计算
文本話題%HAC%層次聚類%特徵計算
문본화제%HAC%층차취류%특정계산
凝聚层次聚类算法是聚类算法实际应用的核心,算法简单效率高并能有效处理大数据集。本文利用数据挖掘技术文本凝聚层次聚类实现对中文文本的话题聚类,具体过程包括中文特征计算、文本分词、话题聚类以及结果展示,主要研究不同粒度中文文本话题聚类方法的实现,通过构建凝聚层次聚类模型(Hierarchical Agglomerative Cluster,HAC)进行文本话题聚类,采用模型参数的调控来改变聚类的粒度。不同粒度的文本话题聚类能展示不同层次的文本归并结果,有效实现定制式的个性化文本信息聚类。
凝聚層次聚類算法是聚類算法實際應用的覈心,算法簡單效率高併能有效處理大數據集。本文利用數據挖掘技術文本凝聚層次聚類實現對中文文本的話題聚類,具體過程包括中文特徵計算、文本分詞、話題聚類以及結果展示,主要研究不同粒度中文文本話題聚類方法的實現,通過構建凝聚層次聚類模型(Hierarchical Agglomerative Cluster,HAC)進行文本話題聚類,採用模型參數的調控來改變聚類的粒度。不同粒度的文本話題聚類能展示不同層次的文本歸併結果,有效實現定製式的箇性化文本信息聚類。
응취층차취류산법시취류산법실제응용적핵심,산법간단효솔고병능유효처리대수거집。본문이용수거알굴기술문본응취층차취류실현대중문문본적화제취류,구체과정포괄중문특정계산、문본분사、화제취류이급결과전시,주요연구불동립도중문문본화제취류방법적실현,통과구건응취층차취류모형(Hierarchical Agglomerative Cluster,HAC)진행문본화제취류,채용모형삼수적조공래개변취류적립도。불동립도적문본화제취류능전시불동층차적문본귀병결과,유효실현정제식적개성화문본신식취류。