吉林大学学报(信息科学版)
吉林大學學報(信息科學版)
길림대학학보(신식과학판)
JOURNAL OF JILIN UNIVERSITY(INFORMATION SCIENCE EDITION)
2007年
1期
50-56
,共7页
刘光远%董立岩%苑森淼%李永丽%刘辉
劉光遠%董立巖%苑森淼%李永麗%劉輝
류광원%동립암%원삼묘%리영려%류휘
数据挖掘%属性选择%卡方算法%相关性概率%位差
數據挖掘%屬性選擇%卡方算法%相關性概率%位差
수거알굴%속성선택%잡방산법%상관성개솔%위차
针对高维数据的数据分析或数据挖掘算法的时间复杂度随着维数增长,时间开销呈指数上升的问题,采用恰当的特征选择方法可以降低数据的维数,并且可以保持原有的数据分辨能力.使用卡方统计量为属性相关性的量化结果,根据卡方表查出独立性置信水平α.对于某属性子集,根据α给出两个有序序列,一个序列是所有属性与分类属性的α有序序列,另一个序列是所有属性与参照属性的α有序序列.利用各个属性在两个序列中位差(位置差异)选择属性.最后给出算法的理论分析,并且给出实验结果和分析.
針對高維數據的數據分析或數據挖掘算法的時間複雜度隨著維數增長,時間開銷呈指數上升的問題,採用恰噹的特徵選擇方法可以降低數據的維數,併且可以保持原有的數據分辨能力.使用卡方統計量為屬性相關性的量化結果,根據卡方錶查齣獨立性置信水平α.對于某屬性子集,根據α給齣兩箇有序序列,一箇序列是所有屬性與分類屬性的α有序序列,另一箇序列是所有屬性與參照屬性的α有序序列.利用各箇屬性在兩箇序列中位差(位置差異)選擇屬性.最後給齣算法的理論分析,併且給齣實驗結果和分析.
침대고유수거적수거분석혹수거알굴산법적시간복잡도수착유수증장,시간개소정지수상승적문제,채용흡당적특정선택방법가이강저수거적유수,병차가이보지원유적수거분변능력.사용잡방통계량위속성상관성적양화결과,근거잡방표사출독립성치신수평α.대우모속성자집,근거α급출량개유서서렬,일개서렬시소유속성여분류속성적α유서서렬,령일개서렬시소유속성여삼조속성적α유서서렬.이용각개속성재량개서렬중위차(위치차이)선택속성.최후급출산법적이론분석,병차급출실험결과화분석.