西安交通大学学报
西安交通大學學報
서안교통대학학보
JOURNAL OF XI'AN JIAOTONG UNIVERSITY
2011年
4期
12-17
,共6页
诸文智%王靖程%张彦斌%贾立新
諸文智%王靖程%張彥斌%賈立新
제문지%왕정정%장언빈%가립신
离散化%信息%有效信息比率
離散化%信息%有效信息比率
리산화%신식%유효신식비솔
针对目前离散化信息量度无法准确表征数据离散后有效分类信息量的问题,提出了一种基于有效信息比率的离散化算法.在构建离散化方案相依表的基础上,分析了离散区间内类属性分布与分类信息蕴含量间的关系,并根据类属性分布信息引入有效信息比率,用于表征各离散区间内有效分类信息量.然后,依据离散化方案的离散区间数及其有效信息比率,设计出表征离散化方案划分质量的离散化评价指标,从而提高了数据的离散化效果.仿真实验和实际应用的结果表明,该算法离散化后在有效分类信息量和分类预测精度上高于主流基于信息论的离散化算法.
針對目前離散化信息量度無法準確錶徵數據離散後有效分類信息量的問題,提齣瞭一種基于有效信息比率的離散化算法.在構建離散化方案相依錶的基礎上,分析瞭離散區間內類屬性分佈與分類信息蘊含量間的關繫,併根據類屬性分佈信息引入有效信息比率,用于錶徵各離散區間內有效分類信息量.然後,依據離散化方案的離散區間數及其有效信息比率,設計齣錶徵離散化方案劃分質量的離散化評價指標,從而提高瞭數據的離散化效果.倣真實驗和實際應用的結果錶明,該算法離散化後在有效分類信息量和分類預測精度上高于主流基于信息論的離散化算法.
침대목전리산화신식량도무법준학표정수거리산후유효분류신식량적문제,제출료일충기우유효신식비솔적리산화산법.재구건리산화방안상의표적기출상,분석료리산구간내류속성분포여분류신식온함량간적관계,병근거류속성분포신식인입유효신식비솔,용우표정각리산구간내유효분류신식량.연후,의거리산화방안적리산구간수급기유효신식비솔,설계출표정리산화방안화분질량적리산화평개지표,종이제고료수거적리산화효과.방진실험화실제응용적결과표명,해산법리산화후재유효분류신식량화분류예측정도상고우주류기우신식론적리산화산법.