计算机工程
計算機工程
계산궤공정
COMPUTER ENGINEERING
2015年
1期
207-210,244
,共5页
数据挖掘%边信息%相似度矩阵%距离度量学习%谱聚类%UCI数据集
數據挖掘%邊信息%相似度矩陣%距離度量學習%譜聚類%UCI數據集
수거알굴%변신식%상사도구진%거리도량학습%보취류%UCI수거집
data mining%side-information%similarity matrix%distance metric learning%spectral clustering%UCI data set
无监督学习聚类算法的性能依赖于用户在输入数据集上指定的距离度量,该距离度量直接影响数据样本之间的相似性计算,因此,不同的距离度量往往对数据集的聚类结果具有重要的影响.针对谱聚类算法中距离度量的选取问题,提出一种基于边信息距离度量学习的谱聚类算法.该算法利用数据集本身蕴涵的边信息,即在数据集中抽样产生的若干数据样本之间是否具有相似性的信息,进行距离度量学习,将学习所得的距离度量准则应用于谱聚类算法的相似度计算函数,并据此构造相似度矩阵.通过在UCI标准数据集上的实验进行分析,结果表明,与标准谱聚类算法相比,该算法的预测精度得到明显提高.
無鑑督學習聚類算法的性能依賴于用戶在輸入數據集上指定的距離度量,該距離度量直接影響數據樣本之間的相似性計算,因此,不同的距離度量往往對數據集的聚類結果具有重要的影響.針對譜聚類算法中距離度量的選取問題,提齣一種基于邊信息距離度量學習的譜聚類算法.該算法利用數據集本身蘊涵的邊信息,即在數據集中抽樣產生的若榦數據樣本之間是否具有相似性的信息,進行距離度量學習,將學習所得的距離度量準則應用于譜聚類算法的相似度計算函數,併據此構造相似度矩陣.通過在UCI標準數據集上的實驗進行分析,結果錶明,與標準譜聚類算法相比,該算法的預測精度得到明顯提高.
무감독학습취류산법적성능의뢰우용호재수입수거집상지정적거리도량,해거리도량직접영향수거양본지간적상사성계산,인차,불동적거리도량왕왕대수거집적취류결과구유중요적영향.침대보취류산법중거리도량적선취문제,제출일충기우변신식거리도량학습적보취류산법.해산법이용수거집본신온함적변신식,즉재수거집중추양산생적약간수거양본지간시부구유상사성적신식,진행거리도량학습,장학습소득적거리도량준칙응용우보취류산법적상사도계산함수,병거차구조상사도구진.통과재UCI표준수거집상적실험진행분석,결과표명,여표준보취류산법상비,해산법적예측정도득도명현제고.