小型微型计算机系统
小型微型計算機繫統
소형미형계산궤계통
MINI-MICRO SYSTEMS
2011年
4期
752-756
,共5页
不完备信息系统%空值补齐%信息粒度%相容类%最小描述长度
不完備信息繫統%空值補齊%信息粒度%相容類%最小描述長度
불완비신식계통%공치보제%신식립도%상용류%최소묘술장도
在现实世界中,不完备信息系统大量存在的,信息系统中空值的存在大大增加了信息表的不确定性,信息表无法产生更多潜在的有价值规则.处理不完备信息表的一种做法是先将空值补齐再提取规则,常用的空值补齐算法通常都是根据同属性其他值出现的频率高低估计空值,但是此方法不一定能保证规则的一致性.本文提出一种基于信息粒度的空值补齐方法GRCC,首先根据定义的信息粒度选择信息粒度最大的列,然后由相容类产生空值的属性值范围,最后利用MDL准则确定遗漏项的属性值,如此逐列进行填充直到完成全部信息表的补齐.经过实验,GRCC算法补齐的信息表比其它补齐方法产生的信息表产生更多高可信度和高支持度的规则,降低了信息表的不确定性.
在現實世界中,不完備信息繫統大量存在的,信息繫統中空值的存在大大增加瞭信息錶的不確定性,信息錶無法產生更多潛在的有價值規則.處理不完備信息錶的一種做法是先將空值補齊再提取規則,常用的空值補齊算法通常都是根據同屬性其他值齣現的頻率高低估計空值,但是此方法不一定能保證規則的一緻性.本文提齣一種基于信息粒度的空值補齊方法GRCC,首先根據定義的信息粒度選擇信息粒度最大的列,然後由相容類產生空值的屬性值範圍,最後利用MDL準則確定遺漏項的屬性值,如此逐列進行填充直到完成全部信息錶的補齊.經過實驗,GRCC算法補齊的信息錶比其它補齊方法產生的信息錶產生更多高可信度和高支持度的規則,降低瞭信息錶的不確定性.
재현실세계중,불완비신식계통대량존재적,신식계통중공치적존재대대증가료신식표적불학정성,신식표무법산생경다잠재적유개치규칙.처리불완비신식표적일충주법시선장공치보제재제취규칙,상용적공치보제산법통상도시근거동속성기타치출현적빈솔고저고계공치,단시차방법불일정능보증규칙적일치성.본문제출일충기우신식립도적공치보제방법GRCC,수선근거정의적신식립도선택신식립도최대적렬,연후유상용류산생공치적속성치범위,최후이용MDL준칙학정유루항적속성치,여차축렬진행전충직도완성전부신식표적보제.경과실험,GRCC산법보제적신식표비기타보제방법산생적신식표산생경다고가신도화고지지도적규칙,강저료신식표적불학정성.