计算机工程与科学
計算機工程與科學
계산궤공정여과학
COMPUTER ENGINEERING & SCIENCE
2014年
1期
169-175
,共7页
样本加权%特征加权%模糊C均值%可能性模糊聚类%核函数
樣本加權%特徵加權%模糊C均值%可能性模糊聚類%覈函數
양본가권%특정가권%모호C균치%가능성모호취류%핵함수
sample weighted%feature weighted%fuzzy C-means%possibilistic fuzzy clustering%kernel
经典的模糊C-均值聚类算法存在对噪声数据较为敏感、未考虑样本属性特征间的不平衡性及对高维数据聚类不理想等问题,而可能性聚类算法虽然解决了噪声敏感和一致性聚类问题,但算法假定每个样本对聚类的贡献程度一样.针对以上问题,提出了一种基于样本-特征加权的可能性模糊核聚类算法,将可能性聚类应用到模糊聚类中以提高其对噪声或例外点的抗干扰能力;同时,根据不同类的具体特性动态计算样本各个属性特征对不同类别的重要性权值及各个样本对聚类的重要性权值,并优化选取核参数,不断修正核函数把原始空间中非线性可分的数据集映射到高维空间中的可分数据集.实验结果表明,基于样本-特征加权模糊聚类算法能够减少噪声数据和例外点的影响,比传统的聚类算法具有更好的聚类准确率.
經典的模糊C-均值聚類算法存在對譟聲數據較為敏感、未攷慮樣本屬性特徵間的不平衡性及對高維數據聚類不理想等問題,而可能性聚類算法雖然解決瞭譟聲敏感和一緻性聚類問題,但算法假定每箇樣本對聚類的貢獻程度一樣.針對以上問題,提齣瞭一種基于樣本-特徵加權的可能性模糊覈聚類算法,將可能性聚類應用到模糊聚類中以提高其對譟聲或例外點的抗榦擾能力;同時,根據不同類的具體特性動態計算樣本各箇屬性特徵對不同類彆的重要性權值及各箇樣本對聚類的重要性權值,併優化選取覈參數,不斷脩正覈函數把原始空間中非線性可分的數據集映射到高維空間中的可分數據集.實驗結果錶明,基于樣本-特徵加權模糊聚類算法能夠減少譟聲數據和例外點的影響,比傳統的聚類算法具有更好的聚類準確率.
경전적모호C-균치취류산법존재대조성수거교위민감、미고필양본속성특정간적불평형성급대고유수거취류불이상등문제,이가능성취류산법수연해결료조성민감화일치성취류문제,단산법가정매개양본대취류적공헌정도일양.침대이상문제,제출료일충기우양본-특정가권적가능성모호핵취류산법,장가능성취류응용도모호취류중이제고기대조성혹예외점적항간우능력;동시,근거불동류적구체특성동태계산양본각개속성특정대불동유별적중요성권치급각개양본대취류적중요성권치,병우화선취핵삼수,불단수정핵함수파원시공간중비선성가분적수거집영사도고유공간중적가분수거집.실험결과표명,기우양본-특정가권모호취류산법능구감소조성수거화예외점적영향,비전통적취류산법구유경호적취류준학솔.