情报学报
情報學報
정보학보
2004年
2期
147-151
,共5页
自动分类%概率神经网络%K-最邻近法
自動分類%概率神經網絡%K-最鄰近法
자동분류%개솔신경망락%K-최린근법
本文提出了将一种径向基网络的重要变形--概率神经网络应用于文本自动分类的研究,与常用的K-最邻近法相比,具有一定的优势,特别是在训练集中各类的训练样本数很不平衡时;与BP等其他神经网络相比,其特点是需调节的参数少,不需确定隐层数、隐层中的神经元数量等网络结构,比较容易使用.此外,从研究中的不同特征选择的评价函数来看,它们对分类有一定的影响,应用X2统计进行特征选择的分类正确率最高,其次是文本证据权,而期望交叉熵的效果最差,说明特征选择在文本自动分类中也是非常重要的.
本文提齣瞭將一種徑嚮基網絡的重要變形--概率神經網絡應用于文本自動分類的研究,與常用的K-最鄰近法相比,具有一定的優勢,特彆是在訓練集中各類的訓練樣本數很不平衡時;與BP等其他神經網絡相比,其特點是需調節的參數少,不需確定隱層數、隱層中的神經元數量等網絡結構,比較容易使用.此外,從研究中的不同特徵選擇的評價函數來看,它們對分類有一定的影響,應用X2統計進行特徵選擇的分類正確率最高,其次是文本證據權,而期望交扠熵的效果最差,說明特徵選擇在文本自動分類中也是非常重要的.
본문제출료장일충경향기망락적중요변형--개솔신경망락응용우문본자동분류적연구,여상용적K-최린근법상비,구유일정적우세,특별시재훈련집중각류적훈련양본수흔불평형시;여BP등기타신경망락상비,기특점시수조절적삼수소,불수학정은층수、은층중적신경원수량등망락결구,비교용역사용.차외,종연구중적불동특정선택적평개함수래간,타문대분류유일정적영향,응용X2통계진행특정선택적분류정학솔최고,기차시문본증거권,이기망교차적적효과최차,설명특정선택재문본자동분류중야시비상중요적.