网友世界·云教育
網友世界·雲教育
망우세계·운교육
Net Friends
2014年
6期
22-22
,共1页
噪音%过滤%kNN分类算法
譟音%過濾%kNN分類算法
조음%과려%kNN분류산법
在数据抽取中,网页中噪音数据的处理是关键的第一步。针对噪音数据类型以及它们在网页中的位置,采取利用启发式规则和基于文本内容方法两种策略分步对噪音数据区域过滤,使用kNN文本分类算法进一步对列表页中的非用户关注栏目过滤。
在數據抽取中,網頁中譟音數據的處理是關鍵的第一步。針對譟音數據類型以及它們在網頁中的位置,採取利用啟髮式規則和基于文本內容方法兩種策略分步對譟音數據區域過濾,使用kNN文本分類算法進一步對列錶頁中的非用戶關註欄目過濾。
재수거추취중,망혈중조음수거적처리시관건적제일보。침대조음수거류형이급타문재망혈중적위치,채취이용계발식규칙화기우문본내용방법량충책략분보대조음수거구역과려,사용kNN문본분류산법진일보대렬표혈중적비용호관주란목과려。