计算机应用
計算機應用
계산궤응용
COMPUTER APPLICATION
2011年
5期
1409-1412
,共4页
离散化%数据挖掘%类-属性相互依赖%变精度粗糙集%决策树
離散化%數據挖掘%類-屬性相互依賴%變精度粗糙集%決策樹
리산화%수거알굴%류-속성상호의뢰%변정도조조집%결책수
很多数据挖掘方法只能处理离散值的属性,因此,连续属性必须进行离散化.提出一种统计相关系数的数据离散化方法,基于统计相关理论有效地捕获了类-属性间的相互依赖,选取最佳断点.此外,将变精度粗糙集(VPRS)模型纳入离散化中,有效地控制数据的信息丢失.将所提方法在乳腺癌症诊断以及其他领域数据上进行了应用,实验结果表明,该方法显著地提高了See5决策树的分类学习精度.
很多數據挖掘方法隻能處理離散值的屬性,因此,連續屬性必鬚進行離散化.提齣一種統計相關繫數的數據離散化方法,基于統計相關理論有效地捕穫瞭類-屬性間的相互依賴,選取最佳斷點.此外,將變精度粗糙集(VPRS)模型納入離散化中,有效地控製數據的信息丟失.將所提方法在乳腺癌癥診斷以及其他領域數據上進行瞭應用,實驗結果錶明,該方法顯著地提高瞭See5決策樹的分類學習精度.
흔다수거알굴방법지능처리리산치적속성,인차,련속속성필수진행리산화.제출일충통계상관계수적수거리산화방법,기우통계상관이론유효지포획료류-속성간적상호의뢰,선취최가단점.차외,장변정도조조집(VPRS)모형납입리산화중,유효지공제수거적신식주실.장소제방법재유선암증진단이급기타영역수거상진행료응용,실험결과표명,해방법현저지제고료See5결책수적분류학습정도.