科学技术与工程
科學技術與工程
과학기술여공정
SCIENCE TECHNOLOGY AND ENGINEERING
2012年
20期
4926-4929
,共4页
苟和平%景永霞%冯百明%李勇
茍和平%景永霞%馮百明%李勇
구화평%경영하%풍백명%리용
K最近邻%文本分类%粗糙集%近似空间
K最近鄰%文本分類%粗糙集%近似空間
K최근린%문본분류%조조집%근사공간
K最近邻算法(KNN)被认为是向量空间模型下最好的分类算法之一.在准确率和召回率方面比较出众,但随着样本数量的增加其相似度计算开销很大.提出一种改进算法RS-KNN,主要是利用粗糙集的相关理论,计算训练样本集中各样本子类的上近似空间和下近似空间,根据待分类文本出现在不同的近似空间.以缩减与待分类样本计算相似度的训练样本个数.实验表明此算法能够有效地降低分类计算开销.
K最近鄰算法(KNN)被認為是嚮量空間模型下最好的分類算法之一.在準確率和召迴率方麵比較齣衆,但隨著樣本數量的增加其相似度計算開銷很大.提齣一種改進算法RS-KNN,主要是利用粗糙集的相關理論,計算訓練樣本集中各樣本子類的上近似空間和下近似空間,根據待分類文本齣現在不同的近似空間.以縮減與待分類樣本計算相似度的訓練樣本箇數.實驗錶明此算法能夠有效地降低分類計算開銷.
K최근린산법(KNN)피인위시향량공간모형하최호적분류산법지일.재준학솔화소회솔방면비교출음,단수착양본수량적증가기상사도계산개소흔대.제출일충개진산법RS-KNN,주요시이용조조집적상관이론,계산훈련양본집중각양본자류적상근사공간화하근사공간,근거대분류문본출현재불동적근사공간.이축감여대분류양본계산상사도적훈련양본개수.실험표명차산법능구유효지강저분류계산개소.