中国科学技术大学学报
中國科學技術大學學報
중국과학기술대학학보
JOURNAL OF UNIVERSITY OF SCIENCE AND TECHNOLOGY OF CHINA
2014年
10期
844-852
,共9页
李大瑞%杨林军%华先胜%张宏江
李大瑞%楊林軍%華先勝%張宏江
리대서%양림군%화선성%장굉강
大规模聚类%k-means%近似算法
大規模聚類%k-means%近似算法
대규모취류%k-means%근사산법
large-scale clustering%k-means%approximate algorithm
视觉特征空间中的大规模聚类问题是图像识别和检索中亟待解决的问题.当前最好的算法是近似k-means算法,它是Lloyd算法的近似算法,只能依靠采用高准确率的近似搜索近似地保证聚类结果的性能.为此针对近似k-means算法提出改进的基本不增加时间、空间代价新算法,具有更好的算法收敛性和聚类性能.该算法利用了迭代求解过程中更多的信息,更有效地更新子类划分,使得聚类损失单调不增并且快速减小.理论证明,采用任意准确率的近似搜索,该算法都可以在有限轮迭代后收敛到Lloyd算法的收敛解.实验结果表明,分别采用最优参数产生同等性能结果时,所提出的算法比近似k-means算法快10倍.此外,通过比较全局特征聚类实验中的子类的图像,也直观地验证了其聚类效果.
視覺特徵空間中的大規模聚類問題是圖像識彆和檢索中亟待解決的問題.噹前最好的算法是近似k-means算法,它是Lloyd算法的近似算法,隻能依靠採用高準確率的近似搜索近似地保證聚類結果的性能.為此針對近似k-means算法提齣改進的基本不增加時間、空間代價新算法,具有更好的算法收斂性和聚類性能.該算法利用瞭迭代求解過程中更多的信息,更有效地更新子類劃分,使得聚類損失單調不增併且快速減小.理論證明,採用任意準確率的近似搜索,該算法都可以在有限輪迭代後收斂到Lloyd算法的收斂解.實驗結果錶明,分彆採用最優參數產生同等性能結果時,所提齣的算法比近似k-means算法快10倍.此外,通過比較全跼特徵聚類實驗中的子類的圖像,也直觀地驗證瞭其聚類效果.
시각특정공간중적대규모취류문제시도상식별화검색중극대해결적문제.당전최호적산법시근사k-means산법,타시Lloyd산법적근사산법,지능의고채용고준학솔적근사수색근사지보증취류결과적성능.위차침대근사k-means산법제출개진적기본불증가시간、공간대개신산법,구유경호적산법수렴성화취류성능.해산법이용료질대구해과정중경다적신식,경유효지경신자류화분,사득취류손실단조불증병차쾌속감소.이론증명,채용임의준학솔적근사수색,해산법도가이재유한륜질대후수렴도Lloyd산법적수렴해.실험결과표명,분별채용최우삼수산생동등성능결과시,소제출적산법비근사k-means산법쾌10배.차외,통과비교전국특정취류실험중적자류적도상,야직관지험증료기취류효과.