计算机应用与软件
計算機應用與軟件
계산궤응용여연건
COMPUTER APPLICATIONS AND SOFTWARE
2010年
6期
8-10,56
,共4页
文本分类%特征选择%贝叶斯方法%特征加权
文本分類%特徵選擇%貝葉斯方法%特徵加權
문본분류%특정선택%패협사방법%특정가권
信息增益方法从整个训练集角度进行特征赋权,该模式不适合构造类别特征向量.通过改进的朴素贝叶斯方法选择类别特征用于构造类别向量,再利用词频信息改进信息增益模型用于文本特征选择,改善了信息增益模型对于中频词信息利用不足问题,提出一种基于类别的文本特征加权改进模型.随后的文本分类试验表明,提出的加权模型相比较于传统的信息增益方法具有较好的文本分类效果.
信息增益方法從整箇訓練集角度進行特徵賦權,該模式不適閤構造類彆特徵嚮量.通過改進的樸素貝葉斯方法選擇類彆特徵用于構造類彆嚮量,再利用詞頻信息改進信息增益模型用于文本特徵選擇,改善瞭信息增益模型對于中頻詞信息利用不足問題,提齣一種基于類彆的文本特徵加權改進模型.隨後的文本分類試驗錶明,提齣的加權模型相比較于傳統的信息增益方法具有較好的文本分類效果.
신식증익방법종정개훈련집각도진행특정부권,해모식불괄합구조유별특정향량.통과개진적박소패협사방법선택유별특정용우구조유별향량,재이용사빈신식개진신식증익모형용우문본특정선택,개선료신식증익모형대우중빈사신식이용불족문제,제출일충기우유별적문본특정가권개진모형.수후적문본분류시험표명,제출적가권모형상비교우전통적신식증익방법구유교호적문본분류효과.