计算机技术与发展
計算機技術與髮展
계산궤기술여발전
COMPUTER TECHNOLOGY AND DEVELOPMENT
2010年
7期
21-24
,共4页
机器学习%模糊粗糙集%Web文本分类%属性约简
機器學習%模糊粗糙集%Web文本分類%屬性約簡
궤기학습%모호조조집%Web문본분류%속성약간
网络信息的多样性和多变性给信息的管理和过滤带来极大困难,为加快网络信息的分类速度和分类精度,提出了一种基于模糊粗糙集的Wdb文本分类方法.采用机器学习的方法:在训练阶段,首先对Web文本信息预处理,用向量空间模型表示文本,生成初始特征属性空间,并进行权值计算;然后用模糊粗糙集算法来进行信息过滤,用基于模糊租糙集的属性约简算法生成分类规则:最后利用知识库进行文档分类.在测试阶段,对未经预处理的文本直接进行关键属性匹配,经模糊粗糙因子加权后,用空间距离法分类.通过试验比较,该方法具有较好的分类效果.
網絡信息的多樣性和多變性給信息的管理和過濾帶來極大睏難,為加快網絡信息的分類速度和分類精度,提齣瞭一種基于模糊粗糙集的Wdb文本分類方法.採用機器學習的方法:在訓練階段,首先對Web文本信息預處理,用嚮量空間模型錶示文本,生成初始特徵屬性空間,併進行權值計算;然後用模糊粗糙集算法來進行信息過濾,用基于模糊租糙集的屬性約簡算法生成分類規則:最後利用知識庫進行文檔分類.在測試階段,對未經預處理的文本直接進行關鍵屬性匹配,經模糊粗糙因子加權後,用空間距離法分類.通過試驗比較,該方法具有較好的分類效果.
망락신식적다양성화다변성급신식적관리화과려대래겁대곤난,위가쾌망락신식적분류속도화분류정도,제출료일충기우모호조조집적Wdb문본분류방법.채용궤기학습적방법:재훈련계단,수선대Web문본신식예처리,용향량공간모형표시문본,생성초시특정속성공간,병진행권치계산;연후용모호조조집산법래진행신식과려,용기우모호조조집적속성약간산법생성분류규칙:최후이용지식고진행문당분류.재측시계단,대미경예처리적문본직접진행관건속성필배,경모호조조인자가권후,용공간거리법분류.통과시험비교,해방법구유교호적분류효과.