计算机应用与软件
計算機應用與軟件
계산궤응용여연건
COMPUTER APPLICATIONS AND SOFTWARE
2014年
6期
154-157
,共4页
K-Prototypes算法%混合数据%划分聚类%相异性度量
K-Prototypes算法%混閤數據%劃分聚類%相異性度量
K-Prototypes산법%혼합수거%화분취류%상이성도량
K-Prototypes algorithm%Mixed data%Partitioned clustering%Dissimilarity measure
在实际应用领域,常常存在同时包含数值型和分类型特征的混合数据.然而,已有的大多数聚类算法只能处理数值型或分类型单一类型数据,因此,提出一个基于划分的混合数据聚类算法.首先给出K-Prototypes算法中分类型数据类中心的多Modes表示方式,进而将传统的欧式距离扩展到混合数据,使之能够在相同框架下更加精确地反映对象与类之间的相异性,在此基础上提出一个用于处理混合数据的划分式聚类算法.最后,在UCI数据集上的实验结果表明,与K-Prototypes算法相比,所提出的算法能够有效提高聚类质量.
在實際應用領域,常常存在同時包含數值型和分類型特徵的混閤數據.然而,已有的大多數聚類算法隻能處理數值型或分類型單一類型數據,因此,提齣一箇基于劃分的混閤數據聚類算法.首先給齣K-Prototypes算法中分類型數據類中心的多Modes錶示方式,進而將傳統的歐式距離擴展到混閤數據,使之能夠在相同框架下更加精確地反映對象與類之間的相異性,在此基礎上提齣一箇用于處理混閤數據的劃分式聚類算法.最後,在UCI數據集上的實驗結果錶明,與K-Prototypes算法相比,所提齣的算法能夠有效提高聚類質量.
재실제응용영역,상상존재동시포함수치형화분류형특정적혼합수거.연이,이유적대다수취류산법지능처리수치형혹분류형단일류형수거,인차,제출일개기우화분적혼합수거취류산법.수선급출K-Prototypes산법중분류형수거류중심적다Modes표시방식,진이장전통적구식거리확전도혼합수거,사지능구재상동광가하경가정학지반영대상여류지간적상이성,재차기출상제출일개용우처리혼합수거적화분식취류산법.최후,재UCI수거집상적실험결과표명,여K-Prototypes산법상비,소제출적산법능구유효제고취류질량.