统计研究
統計研究
통계연구
Statistical Research
2007年
4期
8~11
,共null页
数据挖掘 可辨识矩阵 连续属性 离散化
數據挖掘 可辨識矩陣 連續屬性 離散化
수거알굴 가변식구진 련속속성 리산화
Data mining; discernibility matrix ; continuous properties; discretization
连续属性的离散化在数据挖掘中有着非常重要的作用。本文基于可辨识矩阵提出一种连续属性离散化的方法,并利用平均互信息量对离散化结果进行修正。该方法通过统计模拟取得了良好的效果。
連續屬性的離散化在數據挖掘中有著非常重要的作用。本文基于可辨識矩陣提齣一種連續屬性離散化的方法,併利用平均互信息量對離散化結果進行脩正。該方法通過統計模擬取得瞭良好的效果。
련속속성적리산화재수거알굴중유착비상중요적작용。본문기우가변식구진제출일충련속속성리산화적방법,병이용평균호신식량대리산화결과진행수정。해방법통과통계모의취득료량호적효과。
The discretization of continuous properties is very important in data mining. The paper puts forward a method of diseretization of continuous properties based on discernibility matrix and revises the discrete result by average mutual information. Good effects are achieved through this method by statistical simulation.