科学技术与工程
科學技術與工程
과학기술여공정
SCIENCE TECHNOLOGY AND ENGINEERING
2013年
34期
10359-10363,10368
,共6页
K-均值%聚类算法%噪声数据%迭代%工作效率
K-均值%聚類算法%譟聲數據%迭代%工作效率
K-균치%취류산법%조성수거%질대%공작효솔
K-means%clustering algorithm%noise data%iterative%work efficiency
K-均值聚类算法在当前提取数据挖掘的聚类分析方法中已经取得了一定的成就,为了进一步改进其在数据预处理及神经网络结构中的应用,文中对算法进行了缺陷研究,主要做了以下几个方面的工作:对K-均值算法进行了思路及算法主要流程分析;得出K-均值聚类算法存在简单、迅速、结果簇密集、簇与簇之间区别较为明显等优点;分析得出算法存在与处理符号属性的数据不太适应、必须事先给出k值(想要生成的簇的个数)、对“噪声数据”以及孤立的点数据有较大影响、需要不断计算更新调整后的新聚类中心等缺点.在实验验证中结果得出:聚类结果可知,选取不同的值初始值对聚类结果的影响很小;如果聚类数据集迭代次数较多时,可以尝试着改变其数据的输入顺序;变动数据集的输入顺序,会直接影响聚类结果.实验结果对于K-均值算法的工作效率提高了,具有明显的参考价值,这一研究对于数据挖掘技术的改进具有一定的意义.
K-均值聚類算法在噹前提取數據挖掘的聚類分析方法中已經取得瞭一定的成就,為瞭進一步改進其在數據預處理及神經網絡結構中的應用,文中對算法進行瞭缺陷研究,主要做瞭以下幾箇方麵的工作:對K-均值算法進行瞭思路及算法主要流程分析;得齣K-均值聚類算法存在簡單、迅速、結果簇密集、簇與簇之間區彆較為明顯等優點;分析得齣算法存在與處理符號屬性的數據不太適應、必鬚事先給齣k值(想要生成的簇的箇數)、對“譟聲數據”以及孤立的點數據有較大影響、需要不斷計算更新調整後的新聚類中心等缺點.在實驗驗證中結果得齣:聚類結果可知,選取不同的值初始值對聚類結果的影響很小;如果聚類數據集迭代次數較多時,可以嘗試著改變其數據的輸入順序;變動數據集的輸入順序,會直接影響聚類結果.實驗結果對于K-均值算法的工作效率提高瞭,具有明顯的參攷價值,這一研究對于數據挖掘技術的改進具有一定的意義.
K-균치취류산법재당전제취수거알굴적취류분석방법중이경취득료일정적성취,위료진일보개진기재수거예처리급신경망락결구중적응용,문중대산법진행료결함연구,주요주료이하궤개방면적공작:대K-균치산법진행료사로급산법주요류정분석;득출K-균치취류산법존재간단、신속、결과족밀집、족여족지간구별교위명현등우점;분석득출산법존재여처리부호속성적수거불태괄응、필수사선급출k치(상요생성적족적개수)、대“조성수거”이급고립적점수거유교대영향、수요불단계산경신조정후적신취류중심등결점.재실험험증중결과득출:취류결과가지,선취불동적치초시치대취류결과적영향흔소;여과취류수거집질대차수교다시,가이상시착개변기수거적수입순서;변동수거집적수입순서,회직접영향취류결과.실험결과대우K-균치산법적공작효솔제고료,구유명현적삼고개치,저일연구대우수거알굴기술적개진구유일정적의의.