科学技术与工程
科學技術與工程
과학기술여공정
SCIENCE TECHNOLOGY AND ENGINEERING
2013年
31期
9422-9426
,共5页
文本分类%深度学习%稀疏自动编码器%深度置信网络
文本分類%深度學習%稀疏自動編碼器%深度置信網絡
문본분류%심도학습%희소자동편마기%심도치신망락
text classification%deep learning%sparse autoencoder%deep belief networks
传统的文本分类算法都是采用期望交叉熵、信息增益和互信息等统计方法,通过设置阈值获取特征集.如果训练集的数据量较大,则容易出现特征项不明确、特征信息丢失等缺陷.为解决上述问题,提出运用“深度学习”中的稀疏自动编码器算法自动提取文本特征,然后结合深度置信网络形成SD算法进行文本分类.实验表明,在训练集较少的情况下,SD算法的分类性能低于传统的支持向量机;但是在处理高维数据时,SD算法则比支持向量机具有较高的准确率和召回率.
傳統的文本分類算法都是採用期望交扠熵、信息增益和互信息等統計方法,通過設置閾值穫取特徵集.如果訓練集的數據量較大,則容易齣現特徵項不明確、特徵信息丟失等缺陷.為解決上述問題,提齣運用“深度學習”中的稀疏自動編碼器算法自動提取文本特徵,然後結閤深度置信網絡形成SD算法進行文本分類.實驗錶明,在訓練集較少的情況下,SD算法的分類性能低于傳統的支持嚮量機;但是在處理高維數據時,SD算法則比支持嚮量機具有較高的準確率和召迴率.
전통적문본분류산법도시채용기망교차적、신식증익화호신식등통계방법,통과설치역치획취특정집.여과훈련집적수거량교대,칙용역출현특정항불명학、특정신식주실등결함.위해결상술문제,제출운용“심도학습”중적희소자동편마기산법자동제취문본특정,연후결합심도치신망락형성SD산법진행문본분류.실험표명,재훈련집교소적정황하,SD산법적분류성능저우전통적지지향량궤;단시재처리고유수거시,SD산법칙비지지향량궤구유교고적준학솔화소회솔.