计算机应用研究
計算機應用研究
계산궤응용연구
Application Research of Computers
2015年
12期
3596-3599
,共4页
加权特征选择%聚类%信息熵%邻域分析%特征权值向量
加權特徵選擇%聚類%信息熵%鄰域分析%特徵權值嚮量
가권특정선택%취류%신식적%린역분석%특정권치향량
weighted feature selection%clustering%information gain%neighborhood analysis%feature weight vector
针对面向聚类的特征选择算法效率和效果无法兼顾,并且对高维数据适用度不高的问题,提出了一种基于邻域分析的加权特征选择算法ENFSA.该算法首先基于信息熵构建候选特征集,降低加权特征选择的候选特征维度,在此基础上采用邻域分析法评估特征冗余度和相关性,并根据评估结果更新特征子集和权值向量,不断迭代,直至特征权值向量趋于稳定.在10种典型数据集上的测试结果表明,与传统的特征选择算法相比,新的算法特征约简效率较好,能够明显提高数据集聚类效果,同时在特征维度较高的数据集上依然表现出很好的效果.
針對麵嚮聚類的特徵選擇算法效率和效果無法兼顧,併且對高維數據適用度不高的問題,提齣瞭一種基于鄰域分析的加權特徵選擇算法ENFSA.該算法首先基于信息熵構建候選特徵集,降低加權特徵選擇的候選特徵維度,在此基礎上採用鄰域分析法評估特徵冗餘度和相關性,併根據評估結果更新特徵子集和權值嚮量,不斷迭代,直至特徵權值嚮量趨于穩定.在10種典型數據集上的測試結果錶明,與傳統的特徵選擇算法相比,新的算法特徵約簡效率較好,能夠明顯提高數據集聚類效果,同時在特徵維度較高的數據集上依然錶現齣很好的效果.
침대면향취류적특정선택산법효솔화효과무법겸고,병차대고유수거괄용도불고적문제,제출료일충기우린역분석적가권특정선택산법ENFSA.해산법수선기우신식적구건후선특정집,강저가권특정선택적후선특정유도,재차기출상채용린역분석법평고특정용여도화상관성,병근거평고결과경신특정자집화권치향량,불단질대,직지특정권치향량추우은정.재10충전형수거집상적측시결과표명,여전통적특정선택산법상비,신적산법특정약간효솔교호,능구명현제고수거집취류효과,동시재특정유도교고적수거집상의연표현출흔호적효과.