微计算机信息
微計算機信息
미계산궤신식
CONTROL & AUTOMATION
2010年
9期
190-191,176
,共3页
MapReduce%文本分类%Hadoop%贝叶斯
MapReduce%文本分類%Hadoop%貝葉斯
MapReduce%문본분류%Hadoop%패협사
针对现代大规模文本文档分类在单机计算机上训练和测试过程计算时间长,本文设计和实现了一种基于MapReduce架构的并行贝叶斯文本分类算法.在用普通PC搭建的Hadoop集群上研究实验,结果表明,基于MapReduce架构的贝叶斯文本自动分类算法处理大规模的文档自动分类时,在保证分类效果的情况下,并能获得接近线性的加速比.
針對現代大規模文本文檔分類在單機計算機上訓練和測試過程計算時間長,本文設計和實現瞭一種基于MapReduce架構的併行貝葉斯文本分類算法.在用普通PC搭建的Hadoop集群上研究實驗,結果錶明,基于MapReduce架構的貝葉斯文本自動分類算法處理大規模的文檔自動分類時,在保證分類效果的情況下,併能穫得接近線性的加速比.
침대현대대규모문본문당분류재단궤계산궤상훈련화측시과정계산시간장,본문설계화실현료일충기우MapReduce가구적병행패협사문본분류산법.재용보통PC탑건적Hadoop집군상연구실험,결과표명,기우MapReduce가구적패협사문본자동분류산법처리대규모적문당자동분류시,재보증분류효과적정황하,병능획득접근선성적가속비.