计算机工程与科学
計算機工程與科學
계산궤공정여과학
COMPUTER ENGINEERING & SCIENCE
2015年
5期
1009-1014
,共6页
欧阳浩%王智文%戴喜生%刘智琦
歐暘浩%王智文%戴喜生%劉智琦
구양호%왕지문%대희생%류지기
聚类%信息增益%模糊K-prototypes算法%混合型数据
聚類%信息增益%模糊K-prototypes算法%混閤型數據
취류%신식증익%모호K-prototypes산법%혼합형수거
clustering%information gain%fuzzy K-prototypes%mixed data
K-prototypes聚类算法结合了K-means算法和K-modes算法,可用于分析混合属性的数据对象.传统的K-prototypes聚类算法在计算数据对象的相异度时,未考虑各个属性对于最终聚类结果的影响程度,而现实世界中,各属性的重要程度是不同的.使用了信息论中信息增益的计算方法,来获得各个属性的权值.在计算各属性的差异度时,乘以这些权值,从而可以获得更为准确的聚类结果.为了增加算法处理模糊问题的能力,本算法引用了模糊理论,从而使其具有较好的抗干扰能力和处理不确定性问题的能力.通过对四个UCI数据集的聚类分析实验,表明了本算法的有效性.
K-prototypes聚類算法結閤瞭K-means算法和K-modes算法,可用于分析混閤屬性的數據對象.傳統的K-prototypes聚類算法在計算數據對象的相異度時,未攷慮各箇屬性對于最終聚類結果的影響程度,而現實世界中,各屬性的重要程度是不同的.使用瞭信息論中信息增益的計算方法,來穫得各箇屬性的權值.在計算各屬性的差異度時,乘以這些權值,從而可以穫得更為準確的聚類結果.為瞭增加算法處理模糊問題的能力,本算法引用瞭模糊理論,從而使其具有較好的抗榦擾能力和處理不確定性問題的能力.通過對四箇UCI數據集的聚類分析實驗,錶明瞭本算法的有效性.
K-prototypes취류산법결합료K-means산법화K-modes산법,가용우분석혼합속성적수거대상.전통적K-prototypes취류산법재계산수거대상적상이도시,미고필각개속성대우최종취류결과적영향정도,이현실세계중,각속성적중요정도시불동적.사용료신식론중신식증익적계산방법,래획득각개속성적권치.재계산각속성적차이도시,승이저사권치,종이가이획득경위준학적취류결과.위료증가산법처리모호문제적능력,본산법인용료모호이론,종이사기구유교호적항간우능력화처리불학정성문제적능력.통과대사개UCI수거집적취류분석실험,표명료본산법적유효성.