漳州师范学院学报(自然科学版)
漳州師範學院學報(自然科學版)
장주사범학원학보(자연과학판)
JOURNAL OF ZHANGZHOU TEACHERS COLLEGE(NATURAL SCIENCE EDITION)
2013年
1期
24-28
,共5页
数据挖掘%代价敏感学习%代价限制%分类
數據挖掘%代價敏感學習%代價限製%分類
수거알굴%대개민감학습%대개한제%분류
在测试代价敏感决策系统中,测试代价敏感属性约简方法是一种寻找测试代价尽量小的属性集的有效方法.但是,约简后决策系统只保留了简洁完整的信息,其所构造的分类器精度会有所降低.假设我们拥有有限但多于最小测试代价的资源,那么我们可以充分利用这些资源来获得更高质量的分类器.本文针对这种情况做了以下两个工作:1)我们在最小测试代价约简的基础上添加好属性,寻找一个更好的属性集.2)提出了一种改进的决策树算法,提高分类器质量.该算法选择一些当前最好的属性值来构建结点,这些属性值能够覆盖当前相应的训练集.实验表明:1)改进的决策树算法能够获得比ID3更高的分类准确度;2)与最小测试代价约简的分类器相比,在最小测试代价约简的基础上添加一些的好属性,可以获得更高质量的分类器;3)该方法在减少测试代价开销的同时,保证了分类器的质量.
在測試代價敏感決策繫統中,測試代價敏感屬性約簡方法是一種尋找測試代價儘量小的屬性集的有效方法.但是,約簡後決策繫統隻保留瞭簡潔完整的信息,其所構造的分類器精度會有所降低.假設我們擁有有限但多于最小測試代價的資源,那麽我們可以充分利用這些資源來穫得更高質量的分類器.本文針對這種情況做瞭以下兩箇工作:1)我們在最小測試代價約簡的基礎上添加好屬性,尋找一箇更好的屬性集.2)提齣瞭一種改進的決策樹算法,提高分類器質量.該算法選擇一些噹前最好的屬性值來構建結點,這些屬性值能夠覆蓋噹前相應的訓練集.實驗錶明:1)改進的決策樹算法能夠穫得比ID3更高的分類準確度;2)與最小測試代價約簡的分類器相比,在最小測試代價約簡的基礎上添加一些的好屬性,可以穫得更高質量的分類器;3)該方法在減少測試代價開銷的同時,保證瞭分類器的質量.
재측시대개민감결책계통중,측시대개민감속성약간방법시일충심조측시대개진량소적속성집적유효방법.단시,약간후결책계통지보류료간길완정적신식,기소구조적분류기정도회유소강저.가설아문옹유유한단다우최소측시대개적자원,나요아문가이충분이용저사자원래획득경고질량적분류기.본문침대저충정황주료이하량개공작:1)아문재최소측시대개약간적기출상첨가호속성,심조일개경호적속성집.2)제출료일충개진적결책수산법,제고분류기질량.해산법선택일사당전최호적속성치래구건결점,저사속성치능구복개당전상응적훈련집.실험표명:1)개진적결책수산법능구획득비ID3경고적분류준학도;2)여최소측시대개약간적분류기상비,재최소측시대개약간적기출상첨가일사적호속성,가이획득경고질량적분류기;3)해방법재감소측시대개개소적동시,보증료분류기적질량.