计算机工程
計算機工程
계산궤공정
COMPUTER ENGINEERING
2014年
8期
179-182,189
,共5页
数据挖掘%分类%FOIL算法%LRSM算法%偏离%选择度
數據挖掘%分類%FOIL算法%LRSM算法%偏離%選擇度
수거알굴%분류%FOIL산법%LRSM산법%편리%선택도
data mining%classification%FOIL algorithm%LRSM algorithm%deviation%selectivity
规则式分类器通常使用单一度量选择属性值,然而单一度量会导致很多属性值具有相同的度量值,从而无法选择出“好”的属性值.此外,规则式分类器通常提取置信度为100%的规则,致使规则提取过程比较费时,并且所得到的规则支持度较低.针对上述不足,提出新的属性值度量——选择度.选择度是基于信息熵、类支持度及偏离度3种度量的结合,能更好地区分属性值的优劣.在此基础上,提出一种基于选择度的分类规则学习算法LRSM.在LRSM算法中,当规则包含的负实例数小于给定域值时,该规则被抽取,删除被此规则覆盖的实例,抽取下一条规则.实验结果表明,与FOIL算法相比较,LRSM算法提高了分类准确率,同时明显地减少了分类所消耗的时间.
規則式分類器通常使用單一度量選擇屬性值,然而單一度量會導緻很多屬性值具有相同的度量值,從而無法選擇齣“好”的屬性值.此外,規則式分類器通常提取置信度為100%的規則,緻使規則提取過程比較費時,併且所得到的規則支持度較低.針對上述不足,提齣新的屬性值度量——選擇度.選擇度是基于信息熵、類支持度及偏離度3種度量的結閤,能更好地區分屬性值的優劣.在此基礎上,提齣一種基于選擇度的分類規則學習算法LRSM.在LRSM算法中,噹規則包含的負實例數小于給定域值時,該規則被抽取,刪除被此規則覆蓋的實例,抽取下一條規則.實驗結果錶明,與FOIL算法相比較,LRSM算法提高瞭分類準確率,同時明顯地減少瞭分類所消耗的時間.
규칙식분류기통상사용단일도량선택속성치,연이단일도량회도치흔다속성치구유상동적도량치,종이무법선택출“호”적속성치.차외,규칙식분류기통상제취치신도위100%적규칙,치사규칙제취과정비교비시,병차소득도적규칙지지도교저.침대상술불족,제출신적속성치도량——선택도.선택도시기우신식적、류지지도급편리도3충도량적결합,능경호지구분속성치적우렬.재차기출상,제출일충기우선택도적분류규칙학습산법LRSM.재LRSM산법중,당규칙포함적부실례수소우급정역치시,해규칙피추취,산제피차규칙복개적실례,추취하일조규칙.실험결과표명,여FOIL산법상비교,LRSM산법제고료분류준학솔,동시명현지감소료분류소소모적시간.