计算机工程
計算機工程
계산궤공정
COMPUTER ENGINEERING
2012年
16期
203-206,211
,共5页
分布式%Map Reduce模型%文本分类%集成学习%朴素贝叶斯%Bagging算法
分佈式%Map Reduce模型%文本分類%集成學習%樸素貝葉斯%Bagging算法
분포식%Map Reduce모형%문본분류%집성학습%박소패협사%Bagging산법
集中式系统框架难以进行海量文本数据分类.为此,提出一种基于Map Reduce的Bagging贝叶斯文本分类算法.介绍朴素贝叶斯文本分类算法,将其与Bagging算法结合,运用Map Reduce并行编程模型,在Hadoop平台上实现算法.实验结果表明,该算法分类准确率较高,运行时间较短,适用于大规模文本数据集的分类学习.
集中式繫統框架難以進行海量文本數據分類.為此,提齣一種基于Map Reduce的Bagging貝葉斯文本分類算法.介紹樸素貝葉斯文本分類算法,將其與Bagging算法結閤,運用Map Reduce併行編程模型,在Hadoop平檯上實現算法.實驗結果錶明,該算法分類準確率較高,運行時間較短,適用于大規模文本數據集的分類學習.
집중식계통광가난이진행해량문본수거분류.위차,제출일충기우Map Reduce적Bagging패협사문본분류산법.개소박소패협사문본분류산법,장기여Bagging산법결합,운용Map Reduce병행편정모형,재Hadoop평태상실현산법.실험결과표명,해산법분류준학솔교고,운행시간교단,괄용우대규모문본수거집적분류학습.