哈尔滨工程大学学报
哈爾濱工程大學學報
합이빈공정대학학보
JOURNAL OF HARBIN ENGINEERING UNIVERSITY
2006年
z1期
379-383
,共5页
网格单元%聚类中心%初始化%K-means
網格單元%聚類中心%初始化%K-means
망격단원%취류중심%초시화%K-means
提出了一种有效选择初始聚类中心的算法CNICC.该算法参考了网格聚类算法的思路.划分数据空间为相应维度上的网格单元,然后根据实例的分布情况确定初始聚类中心.从二阶差分的概念出发,CNICC定义了网格单元的一阶邻居和二阶邻居,算法根据每个网格单元的一阶和二阶邻居的局部密度变化寻找包含聚类中心的网格单元.在人工数据集上进行的实验表明,与现有初始化聚类中心的方法相比,CNICC能够有效减少K-means算法的迭代次数,提升聚类精度.同时,随着数据集实例数、维度和网格单元数量的增加,算法的时间复杂度呈线性增加.
提齣瞭一種有效選擇初始聚類中心的算法CNICC.該算法參攷瞭網格聚類算法的思路.劃分數據空間為相應維度上的網格單元,然後根據實例的分佈情況確定初始聚類中心.從二階差分的概唸齣髮,CNICC定義瞭網格單元的一階鄰居和二階鄰居,算法根據每箇網格單元的一階和二階鄰居的跼部密度變化尋找包含聚類中心的網格單元.在人工數據集上進行的實驗錶明,與現有初始化聚類中心的方法相比,CNICC能夠有效減少K-means算法的迭代次數,提升聚類精度.同時,隨著數據集實例數、維度和網格單元數量的增加,算法的時間複雜度呈線性增加.
제출료일충유효선택초시취류중심적산법CNICC.해산법삼고료망격취류산법적사로.화분수거공간위상응유도상적망격단원,연후근거실례적분포정황학정초시취류중심.종이계차분적개념출발,CNICC정의료망격단원적일계린거화이계린거,산법근거매개망격단원적일계화이계린거적국부밀도변화심조포함취류중심적망격단원.재인공수거집상진행적실험표명,여현유초시화취류중심적방법상비,CNICC능구유효감소K-means산법적질대차수,제승취류정도.동시,수착수거집실례수、유도화망격단원수량적증가,산법적시간복잡도정선성증가.