计算机科学
計算機科學
계산궤과학
COMPUTER SCIENCE
2013年
5期
224-228
,共5页
数据聚类%Minkowski距离%分位数%全局信息%量子遗传算法
數據聚類%Minkowski距離%分位數%全跼信息%量子遺傳算法
수거취류%Minkowski거리%분위수%전국신식%양자유전산법
相异度和相似度度量是聚类算法中非常重要的一种因素,往往会影响到聚类分析的结果.很多聚类算法采用欧式距离作为计算数据相似度的度量.而欧式距离不能反映属性值的全局特性,且不顾及各属性之间的量纲差异,因此当不同属性间具有明显量纲或值域差异时,不能取得很好的效果.对此,提出了一种广义加权Minkowski距离,即由各属性的量纲和值域信息来确定各属性的广义权值,既考虑了整个数据集的特性,又消除了各属性之间的不和谐,同时分位数的引进在一定程度上减弱了噪声属性值对距离度量的影响.将提出的新的距离度量用于经典的k-means算法和量子遗传聚类算法,实验结果表明,采用新的距离度量和引进量子遗传算法的聚类是更加有效的.
相異度和相似度度量是聚類算法中非常重要的一種因素,往往會影響到聚類分析的結果.很多聚類算法採用歐式距離作為計算數據相似度的度量.而歐式距離不能反映屬性值的全跼特性,且不顧及各屬性之間的量綱差異,因此噹不同屬性間具有明顯量綱或值域差異時,不能取得很好的效果.對此,提齣瞭一種廣義加權Minkowski距離,即由各屬性的量綱和值域信息來確定各屬性的廣義權值,既攷慮瞭整箇數據集的特性,又消除瞭各屬性之間的不和諧,同時分位數的引進在一定程度上減弱瞭譟聲屬性值對距離度量的影響.將提齣的新的距離度量用于經典的k-means算法和量子遺傳聚類算法,實驗結果錶明,採用新的距離度量和引進量子遺傳算法的聚類是更加有效的.
상이도화상사도도량시취류산법중비상중요적일충인소,왕왕회영향도취류분석적결과.흔다취류산법채용구식거리작위계산수거상사도적도량.이구식거리불능반영속성치적전국특성,차불고급각속성지간적량강차이,인차당불동속성간구유명현량강혹치역차이시,불능취득흔호적효과.대차,제출료일충엄의가권Minkowski거리,즉유각속성적량강화치역신식래학정각속성적엄의권치,기고필료정개수거집적특성,우소제료각속성지간적불화해,동시분위수적인진재일정정도상감약료조성속성치대거리도량적영향.장제출적신적거리도량용우경전적k-means산법화양자유전취류산법,실험결과표명,채용신적거리도량화인진양자유전산법적취류시경가유효적.