情报学报
情報學報
정보학보
2009年
2期
233-241
,共9页
文本分类%分类方法%文本表示%特征选择
文本分類%分類方法%文本錶示%特徵選擇
문본분류%분류방법%문본표시%특정선택
Web自动文本分类是信息检索与数据挖掘领域的研究热点与核心技术,近年来得到了广泛的关注和快速的发展.本文首先分析了国内外Web自动文本分类方法的研究现状,接着对新近出现的多分类器融合的方法、基于群的分类方法、基于RBF网络的文本分类模型、基于模糊-粗糙集的文本分类模型、潜在语义分类模型等新方法,以及K-近邻算法和支持向量机的新发展等进行了深入探讨;并对Web自动文本分类过程中的几个关键技术:文本预处理、文本表示、特征降维、训练方法和分类算法等进行了分析;最后总结了当前Web自动文本分类技术存在的问题及其发展趋势.
Web自動文本分類是信息檢索與數據挖掘領域的研究熱點與覈心技術,近年來得到瞭廣汎的關註和快速的髮展.本文首先分析瞭國內外Web自動文本分類方法的研究現狀,接著對新近齣現的多分類器融閤的方法、基于群的分類方法、基于RBF網絡的文本分類模型、基于模糊-粗糙集的文本分類模型、潛在語義分類模型等新方法,以及K-近鄰算法和支持嚮量機的新髮展等進行瞭深入探討;併對Web自動文本分類過程中的幾箇關鍵技術:文本預處理、文本錶示、特徵降維、訓練方法和分類算法等進行瞭分析;最後總結瞭噹前Web自動文本分類技術存在的問題及其髮展趨勢.
Web자동문본분류시신식검색여수거알굴영역적연구열점여핵심기술,근년래득도료엄범적관주화쾌속적발전.본문수선분석료국내외Web자동문본분류방법적연구현상,접착대신근출현적다분류기융합적방법、기우군적분류방법、기우RBF망락적문본분류모형、기우모호-조조집적문본분류모형、잠재어의분류모형등신방법,이급K-근린산법화지지향량궤적신발전등진행료심입탐토;병대Web자동문본분류과정중적궤개관건기술:문본예처리、문본표시、특정강유、훈련방법화분류산법등진행료분석;최후총결료당전Web자동문본분류기술존재적문제급기발전추세.