模式识别与人工智能
模式識彆與人工智能
모식식별여인공지능
Moshi Shibie yu Rengong Zhineng
2014年
1期
82-88
,共7页
分类算法%交互信息%数据集特征结构
分類算法%交互信息%數據集特徵結構
분류산법%교호신식%수거집특정결구
Classification Algorithm%Interaction Information%Dataset Feature Structure
机器学习分类领域提出大量的分类算法,如何为数据集找到合适的分类算法成为研究的重要内容之一。文献[8]提出一种新的数据集离散化方法用来刻画数据集的特征,且在推荐方法方面取得较好的结果。本文在此基础上利用交互信息理论刻画数据集的属性与属性及属性与类标签之间协作关系,提出基于二变量和基于三变量的交互信息特征结构。通过12种分类算法在UCI数据库中的98个数据集上的性能实验,结果表明与文献[8]的方法相比,两种方法都能明显提高推荐方法的精度和命中率,且对于适应性较差的数据集,基于三变量的交互信息方法更为有效。
機器學習分類領域提齣大量的分類算法,如何為數據集找到閤適的分類算法成為研究的重要內容之一。文獻[8]提齣一種新的數據集離散化方法用來刻畫數據集的特徵,且在推薦方法方麵取得較好的結果。本文在此基礎上利用交互信息理論刻畫數據集的屬性與屬性及屬性與類標籤之間協作關繫,提齣基于二變量和基于三變量的交互信息特徵結構。通過12種分類算法在UCI數據庫中的98箇數據集上的性能實驗,結果錶明與文獻[8]的方法相比,兩種方法都能明顯提高推薦方法的精度和命中率,且對于適應性較差的數據集,基于三變量的交互信息方法更為有效。
궤기학습분류영역제출대량적분류산법,여하위수거집조도합괄적분류산법성위연구적중요내용지일。문헌[8]제출일충신적수거집리산화방법용래각화수거집적특정,차재추천방법방면취득교호적결과。본문재차기출상이용교호신식이론각화수거집적속성여속성급속성여류표첨지간협작관계,제출기우이변량화기우삼변량적교호신식특정결구。통과12충분류산법재UCI수거고중적98개수거집상적성능실험,결과표명여문헌[8]적방법상비,량충방법도능명현제고추천방법적정도화명중솔,차대우괄응성교차적수거집,기우삼변량적교호신식방법경위유효。
In machine learning area, classification algorithms are widely studied and a large number of different types of algorithms are proposed. How to select appropriate ones from so many classification algorithms for the datasets becomes a crucial problem. Recently, a new method in reference [8] is proposed to characterize datasets and achieve better results in algorithm recommendation. In this paper, two methods are presented to characterize datasets under the theory of interaction information. The performance of 12 different types of classification algorithms on the 98 UCI datasets illustrates that both two-variable and three-variable interaction information methods can improve the precision and the hit rate of recommended algorithms. Furthermore, the latter performs even better under datasets with poor adaptability.