计算机工程与设计
計算機工程與設計
계산궤공정여설계
COMPUTER ENGINEERING AND DESIGN
2002年
2期
62-64
,共3页
归并离散%划分离散%切分点%HD偏差%区间距离
歸併離散%劃分離散%切分點%HD偏差%區間距離
귀병리산%화분리산%절분점%HD편차%구간거리
使用信息论的方法进行连续属性的离散化.引入Hellinger偏差HD(Hellinger Divergence)作为每个区间对决策的信息量度量,从而定义切分点的信息熵,最终的离散化结果是使各区间的信息量尽可能平均.分析了HD度量在两种离散化方法中的作用,说明它在划分算法中运用比较理想,而在归并算法中则有局限.
使用信息論的方法進行連續屬性的離散化.引入Hellinger偏差HD(Hellinger Divergence)作為每箇區間對決策的信息量度量,從而定義切分點的信息熵,最終的離散化結果是使各區間的信息量儘可能平均.分析瞭HD度量在兩種離散化方法中的作用,說明它在劃分算法中運用比較理想,而在歸併算法中則有跼限.
사용신식론적방법진행련속속성적리산화.인입Hellinger편차HD(Hellinger Divergence)작위매개구간대결책적신식량도량,종이정의절분점적신식적,최종적리산화결과시사각구간적신식량진가능평균.분석료HD도량재량충리산화방법중적작용,설명타재화분산법중운용비교이상,이재귀병산법중칙유국한.