肇庆学院学报
肇慶學院學報
조경학원학보
JOURNAL OF ZHAOQING UNIVERSITY
2015年
2期
17-22
,共6页
陆海锋%张志华%陈航%谢嵘
陸海鋒%張誌華%陳航%謝嶸
륙해봉%장지화%진항%사영
文本分类%MapReduce%贝叶斯算法%海量数据处理
文本分類%MapReduce%貝葉斯算法%海量數據處理
문본분류%MapReduce%패협사산법%해량수거처리
面对海量数据带来的冲击,传统的单机版贝叶斯分类程序存在处理的数据集有限、内存瓶颈和耗时较长等问题.本文通过对朴素贝叶斯模型进行研究,设计并实现了一种基于MapReduce的朴素贝叶斯文本分类算法.实验表明,该算法具有较好的扩展性和加速比,可适用于海量密集文本分类.
麵對海量數據帶來的遲擊,傳統的單機版貝葉斯分類程序存在處理的數據集有限、內存瓶頸和耗時較長等問題.本文通過對樸素貝葉斯模型進行研究,設計併實現瞭一種基于MapReduce的樸素貝葉斯文本分類算法.實驗錶明,該算法具有較好的擴展性和加速比,可適用于海量密集文本分類.
면대해량수거대래적충격,전통적단궤판패협사분류정서존재처리적수거집유한、내존병경화모시교장등문제.본문통과대박소패협사모형진행연구,설계병실현료일충기우MapReduce적박소패협사문본분류산법.실험표명,해산법구유교호적확전성화가속비,가괄용우해량밀집문본분류.