模式识别与人工智能
模式識彆與人工智能
모식식별여인공지능
Moshi Shibie yu Rengong Zhineng
2009年
6期
848-853
,共6页
王明文%付剑波%罗远胜%陆旭
王明文%付劍波%囉遠勝%陸旭
왕명문%부검파%라원성%륙욱
文本聚类%协同聚类%特征选择
文本聚類%協同聚類%特徵選擇
문본취류%협동취류%특정선택
Text Clustering%Collaborative Clustering%Feature Selection
为了将语义信息用于文本聚类和有效地进行特征选择,文中提出一种基于协同聚类的两阶段文本聚类方法.该方法分别对文档和特征进行聚类从而得到特征与主题之间的语义关联关系.然后利用此关系来相互调整彼此的聚类结果.实验结果表明,利用特征与主题之间的语义关联关系能有效提高聚类效果.
為瞭將語義信息用于文本聚類和有效地進行特徵選擇,文中提齣一種基于協同聚類的兩階段文本聚類方法.該方法分彆對文檔和特徵進行聚類從而得到特徵與主題之間的語義關聯關繫.然後利用此關繫來相互調整彼此的聚類結果.實驗結果錶明,利用特徵與主題之間的語義關聯關繫能有效提高聚類效果.
위료장어의신식용우문본취류화유효지진행특정선택,문중제출일충기우협동취류적량계단문본취류방법.해방법분별대문당화특정진행취류종이득도특정여주제지간적어의관련관계.연후이용차관계래상호조정피차적취류결과.실험결과표명,이용특정여주제지간적어의관련관계능유효제고취류효과.
To take full advantage of the semantic relations for text clustering and feature selection, a kind of two-stage text clustering based on collaborative clustering is proposed. The documents and the features are clustered respectively to capture the semantic relations between features and topics, and these relations are used to adjust the clustering interactively. The experimental results show that the clustering performance is effectively improved by using the relations between features and topics.