计算机应用研究
計算機應用研究
계산궤응용연구
APPLICATION RESEARCH OF COMPUTERS
2012年
4期
1307-1310
,共4页
离散化%数据挖掘%相互依赖%变精度粗糙集%决策树
離散化%數據挖掘%相互依賴%變精度粗糙集%決策樹
리산화%수거알굴%상호의뢰%변정도조조집%결책수
提出一种连续属性值域划分的离散化新方法,该方法定义一个新的离散化函数,依据类与属性之间的相互依赖关系选择最优的离散区间列表;此外,采用变精度粗糙集理论合理地控制数据离散化产生的信息丢失,减少分类错误.仿真结果和统计分析表明,提出的方法有较好的C5.0决策树分类能力.
提齣一種連續屬性值域劃分的離散化新方法,該方法定義一箇新的離散化函數,依據類與屬性之間的相互依賴關繫選擇最優的離散區間列錶;此外,採用變精度粗糙集理論閤理地控製數據離散化產生的信息丟失,減少分類錯誤.倣真結果和統計分析錶明,提齣的方法有較好的C5.0決策樹分類能力.
제출일충련속속성치역화분적리산화신방법,해방법정의일개신적리산화함수,의거류여속성지간적상호의뢰관계선택최우적리산구간렬표;차외,채용변정도조조집이론합리지공제수거리산화산생적신식주실,감소분류착오.방진결과화통계분석표명,제출적방법유교호적C5.0결책수분류능력.