计算机仿真
計算機倣真
계산궤방진
COMPUTER SIMULATION
2011年
1期
218-221
,共4页
数据挖掘%聚类%异常检测%检测率%误警率
數據挖掘%聚類%異常檢測%檢測率%誤警率
수거알굴%취류%이상검측%검측솔%오경솔
聚类分析是数据挖掘的一项关键技术,对于大数据集,确定聚类中心点集所需的计算时间相当的长,针对K-中心算法是一种经典的聚类算法,K-中心在处理小数据集聚类的的问题时,具有良好准确性和伸缩性.但由于K-中心初始中心点是随机选取,聚类过程缓慢,易陷入局部极值,聚类的准确性大大降低.为了提高聚类速度和准确性,提出一种改进的快速K-中心聚类算法.方法首先将训练数据集转换为标准的单位特征度量空间,然后将数据先粗划分为m组,再对m组的k个中心进行聚类找到最优聚类中心,找到聚类中心进行聚类并得到最终聚类结果.以网络入侵数据为例对算法进行了验证性分析,实验结果表明,相对于基本K-中心聚类算法,在保持相同聚类效果的情况下,快速K-中心聚类新算法能够加快聚类速度,节省约聚类时间.
聚類分析是數據挖掘的一項關鍵技術,對于大數據集,確定聚類中心點集所需的計算時間相噹的長,針對K-中心算法是一種經典的聚類算法,K-中心在處理小數據集聚類的的問題時,具有良好準確性和伸縮性.但由于K-中心初始中心點是隨機選取,聚類過程緩慢,易陷入跼部極值,聚類的準確性大大降低.為瞭提高聚類速度和準確性,提齣一種改進的快速K-中心聚類算法.方法首先將訓練數據集轉換為標準的單位特徵度量空間,然後將數據先粗劃分為m組,再對m組的k箇中心進行聚類找到最優聚類中心,找到聚類中心進行聚類併得到最終聚類結果.以網絡入侵數據為例對算法進行瞭驗證性分析,實驗結果錶明,相對于基本K-中心聚類算法,在保持相同聚類效果的情況下,快速K-中心聚類新算法能夠加快聚類速度,節省約聚類時間.
취류분석시수거알굴적일항관건기술,대우대수거집,학정취류중심점집소수적계산시간상당적장,침대K-중심산법시일충경전적취류산법,K-중심재처리소수거집취류적적문제시,구유량호준학성화신축성.단유우K-중심초시중심점시수궤선취,취류과정완만,역함입국부겁치,취류적준학성대대강저.위료제고취류속도화준학성,제출일충개진적쾌속K-중심취류산법.방법수선장훈련수거집전환위표준적단위특정도량공간,연후장수거선조화분위m조,재대m조적k개중심진행취류조도최우취류중심,조도취류중심진행취류병득도최종취류결과.이망락입침수거위례대산법진행료험증성분석,실험결과표명,상대우기본K-중심취류산법,재보지상동취류효과적정황하,쾌속K-중심취류신산법능구가쾌취류속도,절성약취류시간.