计算机应用
計算機應用
계산궤응용
COMPUTER APPLICATION
2005年
11期
2658-2660,2678
,共4页
文本自动分类%特征选择%向量空间模型%朴素贝叶斯%分辨力
文本自動分類%特徵選擇%嚮量空間模型%樸素貝葉斯%分辨力
문본자동분류%특정선택%향량공간모형%박소패협사%분변력
目前的索引词选择算法大多是基于词频的,没有利用训练样本中的类别信息,为此提出了一种新的基于类别的特征选择算法.该算法根据某个词是否存在于文档中导致该类文档相似度的区别,来确定该词区分不同文档的分辨力,以此分辨力作为选取关键词的重要度.以该算法为基础,设计了一个英文文本自动分类系统,并对该系统进行了测试和结果分析.
目前的索引詞選擇算法大多是基于詞頻的,沒有利用訓練樣本中的類彆信息,為此提齣瞭一種新的基于類彆的特徵選擇算法.該算法根據某箇詞是否存在于文檔中導緻該類文檔相似度的區彆,來確定該詞區分不同文檔的分辨力,以此分辨力作為選取關鍵詞的重要度.以該算法為基礎,設計瞭一箇英文文本自動分類繫統,併對該繫統進行瞭測試和結果分析.
목전적색인사선택산법대다시기우사빈적,몰유이용훈련양본중적유별신식,위차제출료일충신적기우유별적특정선택산법.해산법근거모개사시부존재우문당중도치해류문당상사도적구별,래학정해사구분불동문당적분변력,이차분변력작위선취관건사적중요도.이해산법위기출,설계료일개영문문본자동분류계통,병대해계통진행료측시화결과분석.