计算机研究与发展
計算機研究與髮展
계산궤연구여발전
JOURNAL OF COMPUTER RESEARCH AND DEVELOPMENT
2007年
z3期
263-267
,共5页
结构鲁棒性%聚类%迭代优化%有效性
結構魯棒性%聚類%迭代優化%有效性
결구로봉성%취류%질대우화%유효성
聚类结果的有效性由结构有效性、算法有效性和先验知识有效性3个方面的因素决定.忽略先验知识和假设结构的有效性孤立地提升聚类算法的有效性很可能产生无效的聚类结果.现有聚类方法通常只是简单地导出假设结构下最优的聚类结果,并交付用户,缺乏对聚类结果的自省能力.实际上,聚类方法是一个不断迭代优化的过程,包括对训练数据拟合度和假设结构的迭代优化.基于上述的考虑,提出以聚类结构的鲁棒性作为聚类结果有效性的衡量指标,并将鲁棒性评估有机地整合到聚类算法的迭代优化过程中,提出一种面向结构鲁棒性的迭代聚类方法框架.此外,依托该框架下设计并实现了SROC聚类算法,通过对模拟数据和真实文档数据的聚类实验,例证了方法有效性.
聚類結果的有效性由結構有效性、算法有效性和先驗知識有效性3箇方麵的因素決定.忽略先驗知識和假設結構的有效性孤立地提升聚類算法的有效性很可能產生無效的聚類結果.現有聚類方法通常隻是簡單地導齣假設結構下最優的聚類結果,併交付用戶,缺乏對聚類結果的自省能力.實際上,聚類方法是一箇不斷迭代優化的過程,包括對訓練數據擬閤度和假設結構的迭代優化.基于上述的攷慮,提齣以聚類結構的魯棒性作為聚類結果有效性的衡量指標,併將魯棒性評估有機地整閤到聚類算法的迭代優化過程中,提齣一種麵嚮結構魯棒性的迭代聚類方法框架.此外,依託該框架下設計併實現瞭SROC聚類算法,通過對模擬數據和真實文檔數據的聚類實驗,例證瞭方法有效性.
취류결과적유효성유결구유효성、산법유효성화선험지식유효성3개방면적인소결정.홀략선험지식화가설결구적유효성고입지제승취류산법적유효성흔가능산생무효적취류결과.현유취류방법통상지시간단지도출가설결구하최우적취류결과,병교부용호,결핍대취류결과적자성능력.실제상,취류방법시일개불단질대우화적과정,포괄대훈련수거의합도화가설결구적질대우화.기우상술적고필,제출이취류결구적로봉성작위취류결과유효성적형량지표,병장로봉성평고유궤지정합도취류산법적질대우화과정중,제출일충면향결구로봉성적질대취류방법광가.차외,의탁해광가하설계병실현료SROC취류산법,통과대모의수거화진실문당수거적취류실험,예증료방법유효성.