控制理论与应用
控製理論與應用
공제이론여응용
Control Theory & Applications
2015年
8期
993-1002
,共10页
数据挖掘%混合属性%聚类%密度%混合距离度量
數據挖掘%混閤屬性%聚類%密度%混閤距離度量
수거알굴%혼합속성%취류%밀도%혼합거리도량
data mining%mixed attributes%cluster%density%mixed distance measure methods
针对基于密度的传统算法不能处理混合属性数据,以及目前的混合属性聚类算法大多数聚类质量不高等问题,提出了基于密度和混合距离度量方法的混合属性聚类算法.该算法通过分析混合属性数据特征,将混合属性数据分为数值占优、分类占优和均衡型混合属性数据3类,分析不同情况的特征选取相应的距离度量方式,通过预设参数能够发现数据密集区域,确定核心点,再利用核心点确定密度相连的对象实现聚类,获得最终的聚类结果.将算法应用于多种数据集上的实验结果表明,该算法具有较高的聚类质量,能够有效处理混合属性数据.
針對基于密度的傳統算法不能處理混閤屬性數據,以及目前的混閤屬性聚類算法大多數聚類質量不高等問題,提齣瞭基于密度和混閤距離度量方法的混閤屬性聚類算法.該算法通過分析混閤屬性數據特徵,將混閤屬性數據分為數值佔優、分類佔優和均衡型混閤屬性數據3類,分析不同情況的特徵選取相應的距離度量方式,通過預設參數能夠髮現數據密集區域,確定覈心點,再利用覈心點確定密度相連的對象實現聚類,穫得最終的聚類結果.將算法應用于多種數據集上的實驗結果錶明,該算法具有較高的聚類質量,能夠有效處理混閤屬性數據.
침대기우밀도적전통산법불능처리혼합속성수거,이급목전적혼합속성취류산법대다수취류질량불고등문제,제출료기우밀도화혼합거리도량방법적혼합속성취류산법.해산법통과분석혼합속성수거특정,장혼합속성수거분위수치점우、분류점우화균형형혼합속성수거3류,분석불동정황적특정선취상응적거리도량방식,통과예설삼수능구발현수거밀집구역,학정핵심점,재이용핵심점학정밀도상련적대상실현취류,획득최종적취류결과.장산법응용우다충수거집상적실험결과표명,해산법구유교고적취류질량,능구유효처리혼합속성수거.