计算机与现代化
計算機與現代化
계산궤여현대화
COMPUTER AND MODERNIZATION
2008年
11期
69-72
,共4页
文本分类%kNN%特征选择
文本分類%kNN%特徵選擇
문본분류%kNN%특정선택
随着网络技术与数字图书馆的迅猛发展,在线文档迅速增加,自动文本分类已成为处理和组织大量文档数据的关键技术.kNN方法作为一种简单、有效、非参数的分类方法,在文本分类中得到广泛的应用.本文介绍了kNN分类算法的思想以及两种不同的决策规则,并通过实现的文本分类系统对基于离散值规则的kNN方法和基于相似度加权的kNN方法进行实验比较.实验结果表明,基于相似度加权的kNN方法的分类性能要优于基于离散值规则的kNN方法.
隨著網絡技術與數字圖書館的迅猛髮展,在線文檔迅速增加,自動文本分類已成為處理和組織大量文檔數據的關鍵技術.kNN方法作為一種簡單、有效、非參數的分類方法,在文本分類中得到廣汎的應用.本文介紹瞭kNN分類算法的思想以及兩種不同的決策規則,併通過實現的文本分類繫統對基于離散值規則的kNN方法和基于相似度加權的kNN方法進行實驗比較.實驗結果錶明,基于相似度加權的kNN方法的分類性能要優于基于離散值規則的kNN方法.
수착망락기술여수자도서관적신맹발전,재선문당신속증가,자동문본분류이성위처리화조직대량문당수거적관건기술.kNN방법작위일충간단、유효、비삼수적분류방법,재문본분류중득도엄범적응용.본문개소료kNN분류산법적사상이급량충불동적결책규칙,병통과실현적문본분류계통대기우리산치규칙적kNN방법화기우상사도가권적kNN방법진행실험비교.실험결과표명,기우상사도가권적kNN방법적분류성능요우우기우리산치규칙적kNN방법.