计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2009年
3期
148-151
,共4页
数据挖掘%决策树%信息增益%遗传算法
數據挖掘%決策樹%信息增益%遺傳算法
수거알굴%결책수%신식증익%유전산법
决策树是数据挖掘中的一种高效方法,但是当训练数据的属性很多时,构建的决策树的规模会随属性个数增加而指数级增长,进而会产生海量的规则.针对该问题,提出了一种基于遗传算法的优化方法.首先根据信息增益利用轮盘赌方法选取若干组属性,构建多棵决策树,然后利用遗传算法对多棵决策树进行组合,并最终形成规则集.最后给出了实验结果,证明了该方法的可行性和有效性.
決策樹是數據挖掘中的一種高效方法,但是噹訓練數據的屬性很多時,構建的決策樹的規模會隨屬性箇數增加而指數級增長,進而會產生海量的規則.針對該問題,提齣瞭一種基于遺傳算法的優化方法.首先根據信息增益利用輪盤賭方法選取若榦組屬性,構建多棵決策樹,然後利用遺傳算法對多棵決策樹進行組閤,併最終形成規則集.最後給齣瞭實驗結果,證明瞭該方法的可行性和有效性.
결책수시수거알굴중적일충고효방법,단시당훈련수거적속성흔다시,구건적결책수적규모회수속성개수증가이지수급증장,진이회산생해량적규칙.침대해문제,제출료일충기우유전산법적우화방법.수선근거신식증익이용륜반도방법선취약간조속성,구건다과결책수,연후이용유전산법대다과결책수진행조합,병최종형성규칙집.최후급출료실험결과,증명료해방법적가행성화유효성.