北京科技大学学报
北京科技大學學報
북경과기대학학보
JOURNAL OF UNIVERSITY OF SCIENCE AND TECHNOLOGY BEIJING
2008年
8期
963-966
,共4页
徐光美%杨炳儒%秦奕青%张伟
徐光美%楊炳儒%秦奕青%張偉
서광미%양병유%진혁청%장위
朴素贝叶斯%分类器%多关系数据挖掘%归纳逻辑程序设计%互信息
樸素貝葉斯%分類器%多關繫數據挖掘%歸納邏輯程序設計%互信息
박소패협사%분류기%다관계수거알굴%귀납라집정서설계%호신식
为进一步提高多关系朴素贝叶斯方法的分类准确率,分析了已有的剪枝方法,并扩展互信息标准到多关系情况下.基于元组号传播方法和面向元组的统计计数方法,给出了基于扩展互信息标准进行属性选择的方法和步骤,并建立了一种基于扩展互信息的多关系朴素贝叶斯分类器.标准数据集上的实验显示,基于扩展互信息标准进行属性选择,可以在不增加算法时间复杂度的前提下,找到与分类属性最相关的属性,并在仅有极少属性参与分类时,得到较高的分类准确率.Mutagenesis数据集上的实验则显示,这种属性选择可以使多关系问题退化为单关系问题,大大降低了分类代价.
為進一步提高多關繫樸素貝葉斯方法的分類準確率,分析瞭已有的剪枝方法,併擴展互信息標準到多關繫情況下.基于元組號傳播方法和麵嚮元組的統計計數方法,給齣瞭基于擴展互信息標準進行屬性選擇的方法和步驟,併建立瞭一種基于擴展互信息的多關繫樸素貝葉斯分類器.標準數據集上的實驗顯示,基于擴展互信息標準進行屬性選擇,可以在不增加算法時間複雜度的前提下,找到與分類屬性最相關的屬性,併在僅有極少屬性參與分類時,得到較高的分類準確率.Mutagenesis數據集上的實驗則顯示,這種屬性選擇可以使多關繫問題退化為單關繫問題,大大降低瞭分類代價.
위진일보제고다관계박소패협사방법적분류준학솔,분석료이유적전지방법,병확전호신식표준도다관계정황하.기우원조호전파방법화면향원조적통계계수방법,급출료기우확전호신식표준진행속성선택적방법화보취,병건립료일충기우확전호신식적다관계박소패협사분류기.표준수거집상적실험현시,기우확전호신식표준진행속성선택,가이재불증가산법시간복잡도적전제하,조도여분류속성최상관적속성,병재부유겁소속성삼여분류시,득도교고적분류준학솔.Mutagenesis수거집상적실험칙현시,저충속성선택가이사다관계문제퇴화위단관계문제,대대강저료분류대개.