山东大学学报(理学版)
山東大學學報(理學版)
산동대학학보(이학판)
JOURNAL OF SHANDONG UNIVERSITY
2008年
1期
60-64
,共5页
文本聚类%k-means%向量空间模型%局部迭代
文本聚類%k-means%嚮量空間模型%跼部迭代
문본취류%k-means%향량공간모형%국부질대
k-means是目前常用的文本聚类算法,针对其最终搜索的局部极值与全局最优解偏差较大的缺点,采用一种基于局部搜索优化的思想来改进算法,并推导出目标函数的变化公式.根据目标函数值的改变对聚类结果作再次划分后,继续k-means迭代,拓展其搜索范围.理论分析和实验结果表明修改后的算法能有效地提高聚类的质量,且计算复杂度仍与数据集文本总数呈线性变化.
k-means是目前常用的文本聚類算法,針對其最終搜索的跼部極值與全跼最優解偏差較大的缺點,採用一種基于跼部搜索優化的思想來改進算法,併推導齣目標函數的變化公式.根據目標函數值的改變對聚類結果作再次劃分後,繼續k-means迭代,拓展其搜索範圍.理論分析和實驗結果錶明脩改後的算法能有效地提高聚類的質量,且計算複雜度仍與數據集文本總數呈線性變化.
k-means시목전상용적문본취류산법,침대기최종수색적국부겁치여전국최우해편차교대적결점,채용일충기우국부수색우화적사상래개진산법,병추도출목표함수적변화공식.근거목표함수치적개변대취류결과작재차화분후,계속k-means질대,탁전기수색범위.이론분석화실험결과표명수개후적산법능유효지제고취류적질량,차계산복잡도잉여수거집문본총수정선성변화.