浙江大学学报(工学版)
浙江大學學報(工學版)
절강대학학보(공학판)
JOURNAL OF ZHEJIANG UNIVERSITY(ENGINEERING SCIENCE)
2005年
6期
849-852
,共4页
粗糙集%卡方统计量%信息熵%属性重要性%离散化
粗糙集%卡方統計量%信息熵%屬性重要性%離散化
조조집%잡방통계량%신식적%속성중요성%리산화
为解决基于卡方统计量离散化方法在处理未知数据特性时的参数难确定问题,提出了一种基于粗糙集方法的自动离散化方法.该方法根据粗糙集理论对知识不确定性和属性重要性的分析,利用粗糙集方法处理数据不需要先验知识的特点,以基于最小描述长度原理的决策系统信息熵作为离散化过程的评价函数,并由属性断点平均重要性确定多连续属性的离散化顺序,构建了自动的离散化方法RSE-Chi2.实例测试表明,该方法性能良好,能根据样本数据本身的特性,自动协调拟合和预报精度,不需要先验设定显著性水平和不一致率等参数,离散化结果更为精简,所建决策树分类模型具有较好的预报性能.
為解決基于卡方統計量離散化方法在處理未知數據特性時的參數難確定問題,提齣瞭一種基于粗糙集方法的自動離散化方法.該方法根據粗糙集理論對知識不確定性和屬性重要性的分析,利用粗糙集方法處理數據不需要先驗知識的特點,以基于最小描述長度原理的決策繫統信息熵作為離散化過程的評價函數,併由屬性斷點平均重要性確定多連續屬性的離散化順序,構建瞭自動的離散化方法RSE-Chi2.實例測試錶明,該方法性能良好,能根據樣本數據本身的特性,自動協調擬閤和預報精度,不需要先驗設定顯著性水平和不一緻率等參數,離散化結果更為精簡,所建決策樹分類模型具有較好的預報性能.
위해결기우잡방통계량리산화방법재처리미지수거특성시적삼수난학정문제,제출료일충기우조조집방법적자동리산화방법.해방법근거조조집이론대지식불학정성화속성중요성적분석,이용조조집방법처리수거불수요선험지식적특점,이기우최소묘술장도원리적결책계통신식적작위리산화과정적평개함수,병유속성단점평균중요성학정다련속속성적리산화순서,구건료자동적리산화방법RSE-Chi2.실례측시표명,해방법성능량호,능근거양본수거본신적특성,자동협조의합화예보정도,불수요선험설정현저성수평화불일치솔등삼수,리산화결과경위정간,소건결책수분류모형구유교호적예보성능.