电信科学
電信科學
전신과학
TELECOMMUNICATIONS SCIENCE
2012年
7期
40-47
,共8页
琚春华%邹江波%张芮%魏建良
琚春華%鄒江波%張芮%魏建良
거춘화%추강파%장예%위건량
云计算%集成分类器%并行集成%MapReduce
雲計算%集成分類器%併行集成%MapReduce
운계산%집성분류기%병행집성%MapReduce
由于计算机内存资源限制,分类器组合的有效性及最优性选择是机器学习领域的主要研究内容.经典的集成分类算法在处理小数据集时,拥有较高的分类准确性,但面对大量数据时,由于多基分类器学习、分类共用1台计算机资源,导致运算效率较低,这显然不适合处理当今的海量数据.针对已有集成分类算法只适合作用于小规模数据集的缺点,剖析了集成分类器的特性,采用基于聚合方式的集成分类器和云计算的MapReduce技术设计了并行集成分类算法(EMapReduce),达到并行处理大规模数据的目的.并在Amazon计算集群上模拟实验,实验结果表明该算法具有一定的高效性和可行性.
由于計算機內存資源限製,分類器組閤的有效性及最優性選擇是機器學習領域的主要研究內容.經典的集成分類算法在處理小數據集時,擁有較高的分類準確性,但麵對大量數據時,由于多基分類器學習、分類共用1檯計算機資源,導緻運算效率較低,這顯然不適閤處理噹今的海量數據.針對已有集成分類算法隻適閤作用于小規模數據集的缺點,剖析瞭集成分類器的特性,採用基于聚閤方式的集成分類器和雲計算的MapReduce技術設計瞭併行集成分類算法(EMapReduce),達到併行處理大規模數據的目的.併在Amazon計算集群上模擬實驗,實驗結果錶明該算法具有一定的高效性和可行性.
유우계산궤내존자원한제,분류기조합적유효성급최우성선택시궤기학습영역적주요연구내용.경전적집성분류산법재처리소수거집시,옹유교고적분류준학성,단면대대량수거시,유우다기분류기학습、분류공용1태계산궤자원,도치운산효솔교저,저현연불괄합처리당금적해량수거.침대이유집성분류산법지괄합작용우소규모수거집적결점,부석료집성분류기적특성,채용기우취합방식적집성분류기화운계산적MapReduce기술설계료병행집성분류산법(EMapReduce),체도병행처리대규모수거적목적.병재Amazon계산집군상모의실험,실험결과표명해산법구유일정적고효성화가행성.