计算机工程与设计
計算機工程與設計
계산궤공정여설계
COMPUTER ENGINEERING AND DESIGN
2013年
7期
2417-2421,2469
,共6页
林啟锋%蒙祖强%陈秋莲%陈智敏
林啟鋒%矇祖彊%陳鞦蓮%陳智敏
림계봉%몽조강%진추련%진지민
概念聚合%语义关联%文本特征位串%k最近邻算法%文本分类
概唸聚閤%語義關聯%文本特徵位串%k最近鄰算法%文本分類
개념취합%어의관련%문본특정위천%k최근린산법%문본분류
clustering concept%semantic similarity%bit-string%KNN%text categorization
为了有效提高文本分类的效率,提出了一种基于语义相似的改进KNN算法.该算法结合了特征词的语义和文本的特征位串,由于考虑到文本向量中同义的关联特征词对文本相似度的贡献,有效地提高了文本分类的准确率和召回率;而基于文本特征位串进行的位计算方法,能从大量的训练文本集中筛选出可能的相似文本,较好地克服了KNN算法计算量大的问题.算法的分析与实验表明,改进的算法明显提高了KNN的计算效率,同时也提高了分类的准确率和召回率.
為瞭有效提高文本分類的效率,提齣瞭一種基于語義相似的改進KNN算法.該算法結閤瞭特徵詞的語義和文本的特徵位串,由于攷慮到文本嚮量中同義的關聯特徵詞對文本相似度的貢獻,有效地提高瞭文本分類的準確率和召迴率;而基于文本特徵位串進行的位計算方法,能從大量的訓練文本集中篩選齣可能的相似文本,較好地剋服瞭KNN算法計算量大的問題.算法的分析與實驗錶明,改進的算法明顯提高瞭KNN的計算效率,同時也提高瞭分類的準確率和召迴率.
위료유효제고문본분류적효솔,제출료일충기우어의상사적개진KNN산법.해산법결합료특정사적어의화문본적특정위천,유우고필도문본향량중동의적관련특정사대문본상사도적공헌,유효지제고료문본분류적준학솔화소회솔;이기우문본특정위천진행적위계산방법,능종대량적훈련문본집중사선출가능적상사문본,교호지극복료KNN산법계산량대적문제.산법적분석여실험표명,개진적산법명현제고료KNN적계산효솔,동시야제고료분류적준학솔화소회솔.