哈尔滨工程大学学报
哈爾濱工程大學學報
합이빈공정대학학보
JOURNAL OF HARBIN ENGINEERING UNIVERSITY
2008年
11期
1205-1209
,共5页
特征抽取%词条聚合%TGSOM%权重计算
特徵抽取%詞條聚閤%TGSOM%權重計算
특정추취%사조취합%TGSOM%권중계산
特征抽取是文本分类的重要研究领域,针对原始特征空间的高维性与稀疏性给分类算法带来"维数灾难"问题,探讨了基于词条聚合的特征抽取方法,设计了一种利用词条聚合进行特征抽取的文本分类的方案.该方案利用改进的树型动态自组织映射(TGSOM)进行词条聚合,并根据聚合特征的特点,考虑所包含的词条的文档频率的不同和区分文档类别属性的能力的不同,提出了一种新权重计算方法,最后利用SPRINT决策树算法进行分类,实验表明该方法比普通方法分类精度提高4.32%.
特徵抽取是文本分類的重要研究領域,針對原始特徵空間的高維性與稀疏性給分類算法帶來"維數災難"問題,探討瞭基于詞條聚閤的特徵抽取方法,設計瞭一種利用詞條聚閤進行特徵抽取的文本分類的方案.該方案利用改進的樹型動態自組織映射(TGSOM)進行詞條聚閤,併根據聚閤特徵的特點,攷慮所包含的詞條的文檔頻率的不同和區分文檔類彆屬性的能力的不同,提齣瞭一種新權重計算方法,最後利用SPRINT決策樹算法進行分類,實驗錶明該方法比普通方法分類精度提高4.32%.
특정추취시문본분류적중요연구영역,침대원시특정공간적고유성여희소성급분류산법대래"유수재난"문제,탐토료기우사조취합적특정추취방법,설계료일충이용사조취합진행특정추취적문본분류적방안.해방안이용개진적수형동태자조직영사(TGSOM)진행사조취합,병근거취합특정적특점,고필소포함적사조적문당빈솔적불동화구분문당유별속성적능력적불동,제출료일충신권중계산방법,최후이용SPRINT결책수산법진행분류,실험표명해방법비보통방법분류정도제고4.32%.