计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2006年
27期
166-167,170
,共3页
文本分类%未标记%Rocchio法%K近邻法%支持向量机
文本分類%未標記%Rocchio法%K近鄰法%支持嚮量機
문본분류%미표기%Rocchio법%K근린법%지지향량궤
监督学习算法的一个主要困难在于需要大量标记过的训练集数据,采用人工的方法不够现实.文章提出了SVM分类器在少量标记训练样本情况下,采用Rocchio法和KNN方法从大量的未标记数据中,挑选相似度较高、区别度较大的数据加入到训练集中,弥补训练样本的不足.实验表明该算法有效地利用了丰富的未标记数据,减少了人工标记量,较好地提高了SVM分类器的性能.
鑑督學習算法的一箇主要睏難在于需要大量標記過的訓練集數據,採用人工的方法不夠現實.文章提齣瞭SVM分類器在少量標記訓練樣本情況下,採用Rocchio法和KNN方法從大量的未標記數據中,挑選相似度較高、區彆度較大的數據加入到訓練集中,瀰補訓練樣本的不足.實驗錶明該算法有效地利用瞭豐富的未標記數據,減少瞭人工標記量,較好地提高瞭SVM分類器的性能.
감독학습산법적일개주요곤난재우수요대량표기과적훈련집수거,채용인공적방법불구현실.문장제출료SVM분류기재소량표기훈련양본정황하,채용Rocchio법화KNN방법종대량적미표기수거중,도선상사도교고、구별도교대적수거가입도훈련집중,미보훈련양본적불족.실험표명해산법유효지이용료봉부적미표기수거,감소료인공표기량,교호지제고료SVM분류기적성능.