内蒙古民族大学学报(自然科学版)
內矇古民族大學學報(自然科學版)
내몽고민족대학학보(자연과학판)
JOURNAL OF INNER MONGOLIA UNIVERSITY FOR NATIONALITIES(NATURAL SCIENCES)
2009年
2期
143-146
,共4页
决策表%离散化%属性重要性%样本信息熵
決策錶%離散化%屬性重要性%樣本信息熵
결책표%리산화%속성중요성%양본신식적
有效判别决策表中离散化后样本数据的类型对于对后继阶段的机器学习和数据挖掘过程具有非常重要的意义.本文提出了一种基于属性重要性和样本信息熵的数据类型判别方法,并利用人工改造的一部分UCI数据库进行了模拟试验,结果表明方法是有效的,识别样本数据的准确率较高、识别错误率和拒识率较低.
有效判彆決策錶中離散化後樣本數據的類型對于對後繼階段的機器學習和數據挖掘過程具有非常重要的意義.本文提齣瞭一種基于屬性重要性和樣本信息熵的數據類型判彆方法,併利用人工改造的一部分UCI數據庫進行瞭模擬試驗,結果錶明方法是有效的,識彆樣本數據的準確率較高、識彆錯誤率和拒識率較低.
유효판별결책표중리산화후양본수거적류형대우대후계계단적궤기학습화수거알굴과정구유비상중요적의의.본문제출료일충기우속성중요성화양본신식적적수거류형판별방법,병이용인공개조적일부분UCI수거고진행료모의시험,결과표명방법시유효적,식별양본수거적준학솔교고、식별착오솔화거식솔교저.