信息技术与信息化
信息技術與信息化
신식기술여신식화
INFORMATION TECHNOLOGY & INFORMATIZATION
2011年
3期
73-76
,共4页
数据挖掘%分类%两阶段方法%基本显露模式
數據挖掘%分類%兩階段方法%基本顯露模式
수거알굴%분류%량계단방법%기본현로모식
分类是数据挖掘中的重要任务之一.基本显露模式( eEPs)是一种有趣的知识模式,能够反映两个不同数据集之间的某些显著差异并减少分类噪音,适合解决针对稠密数据集和高维数据集的分类问题.但是,传统的采用顺序覆盖策略分类算法无法解决小覆盖问题和反例碎片问题.提出了一种改进的基于eEPs模式的两阶段分类算法,它将eEPs模式作为分类模式,采用两阶段思想来构造分类器,特别是优化了评分策略和两个阶段的权重设置.同时与NB,CBA,C5.0,CMAR,CAEP,BCEP等方法的分类结果进行了比较,在UCI机器学习库中的11个数据集上的实验结果表明了文中提出的算法的有效性.
分類是數據挖掘中的重要任務之一.基本顯露模式( eEPs)是一種有趣的知識模式,能夠反映兩箇不同數據集之間的某些顯著差異併減少分類譟音,適閤解決針對稠密數據集和高維數據集的分類問題.但是,傳統的採用順序覆蓋策略分類算法無法解決小覆蓋問題和反例碎片問題.提齣瞭一種改進的基于eEPs模式的兩階段分類算法,它將eEPs模式作為分類模式,採用兩階段思想來構造分類器,特彆是優化瞭評分策略和兩箇階段的權重設置.同時與NB,CBA,C5.0,CMAR,CAEP,BCEP等方法的分類結果進行瞭比較,在UCI機器學習庫中的11箇數據集上的實驗結果錶明瞭文中提齣的算法的有效性.
분류시수거알굴중적중요임무지일.기본현로모식( eEPs)시일충유취적지식모식,능구반영량개불동수거집지간적모사현저차이병감소분류조음,괄합해결침대주밀수거집화고유수거집적분류문제.단시,전통적채용순서복개책략분류산법무법해결소복개문제화반례쇄편문제.제출료일충개진적기우eEPs모식적량계단분류산법,타장eEPs모식작위분류모식,채용량계단사상래구조분류기,특별시우화료평분책략화량개계단적권중설치.동시여NB,CBA,C5.0,CMAR,CAEP,BCEP등방법적분류결과진행료비교,재UCI궤기학습고중적11개수거집상적실험결과표명료문중제출적산법적유효성.