河北工业大学学报
河北工業大學學報
하북공업대학학보
JOURNAL OF HEBEI UNIVERSITY OF TECHNOLOGY
2007年
1期
35-41
,共7页
钱升华%武优西%柴欣%陈冀川
錢升華%武優西%柴訢%陳冀川
전승화%무우서%시흔%진기천
文本分类%特征选取%分类算法%垃圾短信过滤
文本分類%特徵選取%分類算法%垃圾短信過濾
문본분류%특정선취%분류산법%랄급단신과려
主要介绍了文本分类问题,讨论了文本分类所涉及的关键技术,包括中文分词,文本表示,特征选取方法,以及Rocchio、朴素贝叶斯、K-近邻、决策树、神经网络和支持向量机等文本分类算法的原理和方法.最后,给出了基于文本分类技术的中文垃圾短信过滤方法的实验和结果.
主要介紹瞭文本分類問題,討論瞭文本分類所涉及的關鍵技術,包括中文分詞,文本錶示,特徵選取方法,以及Rocchio、樸素貝葉斯、K-近鄰、決策樹、神經網絡和支持嚮量機等文本分類算法的原理和方法.最後,給齣瞭基于文本分類技術的中文垃圾短信過濾方法的實驗和結果.
주요개소료문본분류문제,토론료문본분류소섭급적관건기술,포괄중문분사,문본표시,특정선취방법,이급Rocchio、박소패협사、K-근린、결책수、신경망락화지지향량궤등문본분류산법적원리화방법.최후,급출료기우문본분류기술적중문랄급단신과려방법적실험화결과.