科学技术与工程
科學技術與工程
과학기술여공정
SCIENCE TECHNOLOGY AND ENGINEERING
2014年
36期
92-96,102
,共6页
kNN%文本分类%投影寻踪%降维%训练集缩减
kNN%文本分類%投影尋蹤%降維%訓練集縮減
kNN%문본분류%투영심종%강유%훈련집축감
kNN%text classification%projection pursuit%dimensionality reduction%training set reduction
传统的后近邻(k-nearest neighbors,kNN)文本分类中,由于文本被表示成向量空间模型后维数非常高,且训练文本的数目巨大,kNN分类算法通常被视为是一种虽然有效,但并非高效的文本分类算法.针对传统kNN分类算法效率低下的问题,提出了一种基于投影寻踪思想的kNN分类算法加速策略.基本思想是:通过投影的方法缩减训练集的规模,同时在寻找七近邻过程中对文本进行降维处理,从两方面着手降低算法的计算开销.实验数据表明,优化后的kNN算法比传统kNN算法在时间性能上有较大的提升,同时保证了分类的精度.
傳統的後近鄰(k-nearest neighbors,kNN)文本分類中,由于文本被錶示成嚮量空間模型後維數非常高,且訓練文本的數目巨大,kNN分類算法通常被視為是一種雖然有效,但併非高效的文本分類算法.針對傳統kNN分類算法效率低下的問題,提齣瞭一種基于投影尋蹤思想的kNN分類算法加速策略.基本思想是:通過投影的方法縮減訓練集的規模,同時在尋找七近鄰過程中對文本進行降維處理,從兩方麵著手降低算法的計算開銷.實驗數據錶明,優化後的kNN算法比傳統kNN算法在時間性能上有較大的提升,同時保證瞭分類的精度.
전통적후근린(k-nearest neighbors,kNN)문본분류중,유우문본피표시성향량공간모형후유수비상고,차훈련문본적수목거대,kNN분류산법통상피시위시일충수연유효,단병비고효적문본분류산법.침대전통kNN분류산법효솔저하적문제,제출료일충기우투영심종사상적kNN분류산법가속책략.기본사상시:통과투영적방법축감훈련집적규모,동시재심조칠근린과정중대문본진행강유처리,종량방면착수강저산법적계산개소.실험수거표명,우화후적kNN산법비전통kNN산법재시간성능상유교대적제승,동시보증료분류적정도.