计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2011年
30期
127-131
,共5页
数据清洗%重复记录%模式规约%聚类学习%反馈学习
數據清洗%重複記錄%模式規約%聚類學習%反饋學習
수거청세%중복기록%모식규약%취류학습%반궤학습
重复记录的清除是数据清洗领域的核心问题,但如何实施有效的清除一直是研究的难点.提出了一种通过建立聚类反馈模式规约来验证重复记录的有效性方法.依据经过聚类后各个类别间的关联性关系分析,首先提出了聚类模式和反馈模式的概念和实现方法;然后给出了数据清洗中聚类反馈模式规约;最后应用项目案例验证了它的有效性.
重複記錄的清除是數據清洗領域的覈心問題,但如何實施有效的清除一直是研究的難點.提齣瞭一種通過建立聚類反饋模式規約來驗證重複記錄的有效性方法.依據經過聚類後各箇類彆間的關聯性關繫分析,首先提齣瞭聚類模式和反饋模式的概唸和實現方法;然後給齣瞭數據清洗中聚類反饋模式規約;最後應用項目案例驗證瞭它的有效性.
중복기록적청제시수거청세영역적핵심문제,단여하실시유효적청제일직시연구적난점.제출료일충통과건립취류반궤모식규약래험증중복기록적유효성방법.의거경과취류후각개유별간적관련성관계분석,수선제출료취류모식화반궤모식적개념화실현방법;연후급출료수거청세중취류반궤모식규약;최후응용항목안례험증료타적유효성.