计算机技术与发展
計算機技術與髮展
계산궤기술여발전
Computer Technology and Development
2015年
9期
89-93
,共5页
贝叶斯%最小风险%文本分类%短信过滤
貝葉斯%最小風險%文本分類%短信過濾
패협사%최소풍험%문본분류%단신과려
Bayes%minimum risk%text classification%message filtering
随着信息交流的频繁性,各种骚扰和垃圾短信充斥手机,严重干扰了人们的正常生活。针对垃圾短信过滤技术,研究基于最小风险决策贝叶斯的文本分类器构造方法以及实现。对于朴素贝叶斯在短信过滤系统中过分依赖样本空间的分布和内在的不稳定性,造成了时间复杂度的增加,提出了一种基于改进贝叶斯的垃圾短信文本分类器构造方法。主要利用最小风险决策算法结合贝叶斯理论完成对批量短信的训练,形成对应的集合模型。对实现文本分类的关键技术做了重点叙述,并对文本分类算法进行了实现。最后对算法进行测试,结果表明:基于最小风险决策贝叶斯的文本分类器不仅训练简单,而且分类准确度高,解决了朴素贝叶斯算法的不稳定性,为短信过滤技术提供了借鉴。
隨著信息交流的頻繁性,各種騷擾和垃圾短信充斥手機,嚴重榦擾瞭人們的正常生活。針對垃圾短信過濾技術,研究基于最小風險決策貝葉斯的文本分類器構造方法以及實現。對于樸素貝葉斯在短信過濾繫統中過分依賴樣本空間的分佈和內在的不穩定性,造成瞭時間複雜度的增加,提齣瞭一種基于改進貝葉斯的垃圾短信文本分類器構造方法。主要利用最小風險決策算法結閤貝葉斯理論完成對批量短信的訓練,形成對應的集閤模型。對實現文本分類的關鍵技術做瞭重點敘述,併對文本分類算法進行瞭實現。最後對算法進行測試,結果錶明:基于最小風險決策貝葉斯的文本分類器不僅訓練簡單,而且分類準確度高,解決瞭樸素貝葉斯算法的不穩定性,為短信過濾技術提供瞭藉鑒。
수착신식교류적빈번성,각충소우화랄급단신충척수궤,엄중간우료인문적정상생활。침대랄급단신과려기술,연구기우최소풍험결책패협사적문본분류기구조방법이급실현。대우박소패협사재단신과려계통중과분의뢰양본공간적분포화내재적불은정성,조성료시간복잡도적증가,제출료일충기우개진패협사적랄급단신문본분류기구조방법。주요이용최소풍험결책산법결합패협사이론완성대비량단신적훈련,형성대응적집합모형。대실현문본분류적관건기술주료중점서술,병대문본분류산법진행료실현。최후대산법진행측시,결과표명:기우최소풍험결책패협사적문본분류기불부훈련간단,이차분류준학도고,해결료박소패협사산법적불은정성,위단신과려기술제공료차감。
With frequent exchanges of information,various harassing messages with mobile phone disturb the normal life for people. For spam filtering technology,research the constructing method and its realization for text classifier based on optimized Na?ve Bayesian algo-rithm. The distribution of Naive Bayesian over-reliance on sample space in the short message filtering system and the inherent instability cause an increase in time complexity,propose a spam message structure text classifier based on the improved Bayesian method. The meth-od uses the Bayesian theory and minimum risk decision algorithm to complete the training of bulk SMS. Describe the key technologies of text classification and implement the text classification algorithm. The test results show that the new algorithm can easily train and im-prove the classification accuracy,solving the instability of Na?ve Bayesian algorithm,which provides a reference for filtering technology.