计算机应用研究
計算機應用研究
계산궤응용연구
APPLICATION RESEARCH OF COMPUTERS
2013年
1期
103-106,123
,共5页
最大中心间隔%数据缩放%极大熵聚类%中心一致
最大中心間隔%數據縮放%極大熵聚類%中心一緻
최대중심간격%수거축방%겁대적취류%중심일치
为了调控数据之间的差异性,一般化的处理方式是对数据简单地进行按比例缩放,而此类做法本身对于数据的信息是不存在任何破坏的.但在进行聚类分析时,大部分算法对于按比缩放的数据都是很敏感的,其中较典型的算法有极大熵聚类(MEC)算法.大量的实验表明,当缩放尺度位于10-3数量级以下时,极大熵聚类算法已经失效,通过该算法得到的聚类中心趋于一致.为了解决上述问题,在MEC算法的基础上引入最大中心间隔项与缩放因子η,构造出了全新的目标函数,称为η型最大中心间隔极大熵聚类(η-MCS-MEC)算法.该算法通过调控中心点间的距离使之达到最大,并有效利用缩放因子η对各类划分进行调控,从而避免了聚类中心趋于一致.通过在模拟数据集以及UCI仿真数据集上的实验,结果均显示出算法对变化的数据不再敏感而具有鲁棒性.
為瞭調控數據之間的差異性,一般化的處理方式是對數據簡單地進行按比例縮放,而此類做法本身對于數據的信息是不存在任何破壞的.但在進行聚類分析時,大部分算法對于按比縮放的數據都是很敏感的,其中較典型的算法有極大熵聚類(MEC)算法.大量的實驗錶明,噹縮放呎度位于10-3數量級以下時,極大熵聚類算法已經失效,通過該算法得到的聚類中心趨于一緻.為瞭解決上述問題,在MEC算法的基礎上引入最大中心間隔項與縮放因子η,構造齣瞭全新的目標函數,稱為η型最大中心間隔極大熵聚類(η-MCS-MEC)算法.該算法通過調控中心點間的距離使之達到最大,併有效利用縮放因子η對各類劃分進行調控,從而避免瞭聚類中心趨于一緻.通過在模擬數據集以及UCI倣真數據集上的實驗,結果均顯示齣算法對變化的數據不再敏感而具有魯棒性.
위료조공수거지간적차이성,일반화적처리방식시대수거간단지진행안비례축방,이차류주법본신대우수거적신식시불존재임하파배적.단재진행취류분석시,대부분산법대우안비축방적수거도시흔민감적,기중교전형적산법유겁대적취류(MEC)산법.대량적실험표명,당축방척도위우10-3수량급이하시,겁대적취류산법이경실효,통과해산법득도적취류중심추우일치.위료해결상술문제,재MEC산법적기출상인입최대중심간격항여축방인자η,구조출료전신적목표함수,칭위η형최대중심간격겁대적취류(η-MCS-MEC)산법.해산법통과조공중심점간적거리사지체도최대,병유효이용축방인자η대각류화분진행조공,종이피면료취류중심추우일치.통과재모의수거집이급UCI방진수거집상적실험,결과균현시출산법대변화적수거불재민감이구유로봉성.