合肥工业大学学报(自然科学版)
閤肥工業大學學報(自然科學版)
합비공업대학학보(자연과학판)
JOURNAL OF HEFEI UNIVERSITY OF TECHNOLOGY(NATURAL SCIENCE)
2010年
12期
1811-1814
,共4页
信息值%属性选择%分类
信息值%屬性選擇%分類
신식치%속성선택%분류
数据挖掘所面对的数据常具有属性冗余、包含噪音等特点,使得更注重训练数据质量的分类模型训练周期变长、精度下降.因此,如何选择有效的属性集以约减数据规模,提高分类模型性能具有重要意义.文章将IV模型用于属性选择,提出了基于IV指标的属性选择算法FS-IV,该算法仅需一遍扫描计算出所需的相关统计量,解决了传统属性选择方法处理较大规模数据时空效率不高的问题.实验表明,FS-IV属性选择方法时空性能良好,对冗余、噪音属性均有较好的区分能力,能够有效地约减数据规模.
數據挖掘所麵對的數據常具有屬性冗餘、包含譟音等特點,使得更註重訓練數據質量的分類模型訓練週期變長、精度下降.因此,如何選擇有效的屬性集以約減數據規模,提高分類模型性能具有重要意義.文章將IV模型用于屬性選擇,提齣瞭基于IV指標的屬性選擇算法FS-IV,該算法僅需一遍掃描計算齣所需的相關統計量,解決瞭傳統屬性選擇方法處理較大規模數據時空效率不高的問題.實驗錶明,FS-IV屬性選擇方法時空性能良好,對冗餘、譟音屬性均有較好的區分能力,能夠有效地約減數據規模.
수거알굴소면대적수거상구유속성용여、포함조음등특점,사득경주중훈련수거질량적분류모형훈련주기변장、정도하강.인차,여하선택유효적속성집이약감수거규모,제고분류모형성능구유중요의의.문장장IV모형용우속성선택,제출료기우IV지표적속성선택산법FS-IV,해산법부수일편소묘계산출소수적상관통계량,해결료전통속성선택방법처리교대규모수거시공효솔불고적문제.실험표명,FS-IV속성선택방법시공성능량호,대용여、조음속성균유교호적구분능력,능구유효지약감수거규모.