计算机技术与发展
計算機技術與髮展
계산궤기술여발전
COMPUTER TECHNOLOGY AND DEVELOPMENT
2011年
5期
9-12
,共4页
分类%稀有类%主成分分析%样本大小
分類%稀有類%主成分分析%樣本大小
분류%희유류%주성분분석%양본대소
分类稀有类在现实生活中的很多领域都有广泛的应用,但普通的分类算法在分类稀有类时往往失效.探讨了影响稀有类分类的各个因素,针对影响稀有类中的一个因素,样本大小对稀有类的影响进行了研究.对于UCI学习库中的三个数据集,在weka平台上使用Roration Forest进行实验,对于相同的类比率,使用unsupervised resample数据预处理方法使样本由小变大.结果表明在特定的类比率下,使样本变大,由数据的不平衡分布造成的分类错误下降,普通的分类算法在分类稀有类时往往也可以取得很好的分类结果.
分類稀有類在現實生活中的很多領域都有廣汎的應用,但普通的分類算法在分類稀有類時往往失效.探討瞭影響稀有類分類的各箇因素,針對影響稀有類中的一箇因素,樣本大小對稀有類的影響進行瞭研究.對于UCI學習庫中的三箇數據集,在weka平檯上使用Roration Forest進行實驗,對于相同的類比率,使用unsupervised resample數據預處理方法使樣本由小變大.結果錶明在特定的類比率下,使樣本變大,由數據的不平衡分佈造成的分類錯誤下降,普通的分類算法在分類稀有類時往往也可以取得很好的分類結果.
분류희유류재현실생활중적흔다영역도유엄범적응용,단보통적분류산법재분류희유류시왕왕실효.탐토료영향희유류분류적각개인소,침대영향희유류중적일개인소,양본대소대희유류적영향진행료연구.대우UCI학습고중적삼개수거집,재weka평태상사용Roration Forest진행실험,대우상동적류비솔,사용unsupervised resample수거예처리방법사양본유소변대.결과표명재특정적류비솔하,사양본변대,유수거적불평형분포조성적분류착오하강,보통적분류산법재분류희유류시왕왕야가이취득흔호적분류결과.