北京理工大学学报
北京理工大學學報
북경리공대학학보
JOURNAL OF BEIJING INSTITUTE OF TECHNOLOGY
2006年
12期
1069-1072
,共4页
类别特征库%类别特征权重向量模型%压缩文档向量表示
類彆特徵庫%類彆特徵權重嚮量模型%壓縮文檔嚮量錶示
유별특정고%유별특정권중향량모형%압축문당향량표시
为实现无维数约减技术而使分类算法可行且不浪费空间存储的超稀疏文档向量,同时保证分类精度和速度且两者相互独立的目标,提出使用类别特征信息数据库、类别特征权重向量模型、待归类文档压缩向量表示法和改进的Rocchio分类算法等技术实现文档的高速归类. 在相同的Reuters测试语料集上,与CRF算法和改进的kNN算法进行对比实验. 结果表明,在基本不牺牲精度的情况下,归类算法的分类速度明显高于对比算法.
為實現無維數約減技術而使分類算法可行且不浪費空間存儲的超稀疏文檔嚮量,同時保證分類精度和速度且兩者相互獨立的目標,提齣使用類彆特徵信息數據庫、類彆特徵權重嚮量模型、待歸類文檔壓縮嚮量錶示法和改進的Rocchio分類算法等技術實現文檔的高速歸類. 在相同的Reuters測試語料集上,與CRF算法和改進的kNN算法進行對比實驗. 結果錶明,在基本不犧牲精度的情況下,歸類算法的分類速度明顯高于對比算法.
위실현무유수약감기술이사분류산법가행차불낭비공간존저적초희소문당향량,동시보증분류정도화속도차량자상호독립적목표,제출사용유별특정신식수거고、유별특정권중향량모형、대귀류문당압축향량표시법화개진적Rocchio분류산법등기술실현문당적고속귀류. 재상동적Reuters측시어료집상,여CRF산법화개진적kNN산법진행대비실험. 결과표명,재기본불희생정도적정황하,귀류산법적분류속도명현고우대비산법.