兰州理工大学学报
蘭州理工大學學報
란주리공대학학보
JOURNAL OF LANZHOU UNIVERSITY OF TECHNOLOGY
2009年
3期
98-102
,共5页
分类属性数据%量子聚类%聚类算法%相异性度量测度
分類屬性數據%量子聚類%聚類算法%相異性度量測度
분류속성수거%양자취류%취류산법%상이성도량측도
分析量子势能、量子力学中粒子分布机制和针对分类属性数据的量子聚类CQC算法,发现该算法采用传统的Hamming相异性测度计算分类属性数据间的相异性测度,忽略分类属性取值自身的涵义和值间的特征关联,导致其聚类准确性较差.提出一种改进的MCQC算法,能根据数据对象的关联情况计算同属性不同值间的相异性,计算数据对象间的相异性测度,从而提高聚类准确率.仿真实验采用3个数据集,即:大豆疾病、国会投票真实数据集和从KDD-CUP99训练样本集抽取离散属性维构成的人造样本集.实验结果表明,该算法是有效且可行的,对分类属性、二值属性和混合属性数据的聚类准确率明显高于CQC算法.
分析量子勢能、量子力學中粒子分佈機製和針對分類屬性數據的量子聚類CQC算法,髮現該算法採用傳統的Hamming相異性測度計算分類屬性數據間的相異性測度,忽略分類屬性取值自身的涵義和值間的特徵關聯,導緻其聚類準確性較差.提齣一種改進的MCQC算法,能根據數據對象的關聯情況計算同屬性不同值間的相異性,計算數據對象間的相異性測度,從而提高聚類準確率.倣真實驗採用3箇數據集,即:大豆疾病、國會投票真實數據集和從KDD-CUP99訓練樣本集抽取離散屬性維構成的人造樣本集.實驗結果錶明,該算法是有效且可行的,對分類屬性、二值屬性和混閤屬性數據的聚類準確率明顯高于CQC算法.
분석양자세능、양자역학중입자분포궤제화침대분류속성수거적양자취류CQC산법,발현해산법채용전통적Hamming상이성측도계산분류속성수거간적상이성측도,홀략분류속성취치자신적함의화치간적특정관련,도치기취류준학성교차.제출일충개진적MCQC산법,능근거수거대상적관련정황계산동속성불동치간적상이성,계산수거대상간적상이성측도,종이제고취류준학솔.방진실험채용3개수거집,즉:대두질병、국회투표진실수거집화종KDD-CUP99훈련양본집추취리산속성유구성적인조양본집.실험결과표명,해산법시유효차가행적,대분류속성、이치속성화혼합속성수거적취류준학솔명현고우CQC산법.