计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2007年
13期
159-162,166
,共5页
王煜%张明%王正欧%白石
王煜%張明%王正歐%白石
왕욱%장명%왕정구%백석
文本分类%KNN算法%灵敏度法%CURE聚类算法%Tabu算法
文本分類%KNN算法%靈敏度法%CURE聚類算法%Tabu算法
문본분류%KNN산법%령민도법%CURE취류산법%Tabu산법
采用灵敏度方法对距离公式中文本特征的权重进行修正;提出一种基于CURE算法和Tabu算法的训练样本库的裁减方法,采用CURE聚类算法获得每个聚类的代表样本组成新的训练样本集合,然后用Tabu算法对此样本集合进行进一步维护(添加或删除样本),添加样本时只考虑增加不同类交界处的样本,添加或删除样本以分类精度最高、与原始训练样本库距离最近为原则.
採用靈敏度方法對距離公式中文本特徵的權重進行脩正;提齣一種基于CURE算法和Tabu算法的訓練樣本庫的裁減方法,採用CURE聚類算法穫得每箇聚類的代錶樣本組成新的訓練樣本集閤,然後用Tabu算法對此樣本集閤進行進一步維護(添加或刪除樣本),添加樣本時隻攷慮增加不同類交界處的樣本,添加或刪除樣本以分類精度最高、與原始訓練樣本庫距離最近為原則.
채용령민도방법대거리공식중문본특정적권중진행수정;제출일충기우CURE산법화Tabu산법적훈련양본고적재감방법,채용CURE취류산법획득매개취류적대표양본조성신적훈련양본집합,연후용Tabu산법대차양본집합진행진일보유호(첨가혹산제양본),첨가양본시지고필증가불동류교계처적양본,첨가혹산제양본이분류정도최고、여원시훈련양본고거리최근위원칙.