计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2010年
21期
156-159
,共4页
数据聚类%可拓距离%可拓K近邻算法%属性约简
數據聚類%可拓距離%可拓K近鄰算法%屬性約簡
수거취류%가탁거리%가탁K근린산법%속성약간
针对区间值数据的数据聚类问题,根据可拓学关联函数的定义,提出可拓距离的概念来度量数据之间的距离,利用K近邻的思想,根据可拓距离的大小对数据集的目标属性进行投票选择进行分类,设计了可拓K近邻算法(Extension K Nearest Neighbor,EKNN).最后利用UCI的两个基准数据集Iris植物样本数据和糖尿病数据库PIDD进行验证,首先通过免疫网络约简算法对条件属性进行最小属性约简,然后利用EKNN算法分析和比较不同最小约简属性下的分类准确率.
針對區間值數據的數據聚類問題,根據可拓學關聯函數的定義,提齣可拓距離的概唸來度量數據之間的距離,利用K近鄰的思想,根據可拓距離的大小對數據集的目標屬性進行投票選擇進行分類,設計瞭可拓K近鄰算法(Extension K Nearest Neighbor,EKNN).最後利用UCI的兩箇基準數據集Iris植物樣本數據和糖尿病數據庫PIDD進行驗證,首先通過免疫網絡約簡算法對條件屬性進行最小屬性約簡,然後利用EKNN算法分析和比較不同最小約簡屬性下的分類準確率.
침대구간치수거적수거취류문제,근거가탁학관련함수적정의,제출가탁거리적개념래도량수거지간적거리,이용K근린적사상,근거가탁거리적대소대수거집적목표속성진행투표선택진행분류,설계료가탁K근린산법(Extension K Nearest Neighbor,EKNN).최후이용UCI적량개기준수거집Iris식물양본수거화당뇨병수거고PIDD진행험증,수선통과면역망락약간산법대조건속성진행최소속성약간,연후이용EKNN산법분석화비교불동최소약간속성하적분류준학솔.