计算机技术与发展
計算機技術與髮展
계산궤기술여발전
COMPUTER TECHNOLOGY AND DEVELOPMENT
2011年
8期
149-152
,共4页
李远方%贾时银%邓世昆%韩月阳
李遠方%賈時銀%鄧世昆%韓月暘
리원방%가시은%산세곤%한월양
树结构%MapReduce%XML%Hadoop
樹結構%MapReduce%XML%Hadoop
수결구%MapReduce%XML%Hadoop
MapReduce是Google开发的一种并行分布式计算模型,已在搜索和处理海量数据领域得到了广泛的应用.此模型只适用于数据关联性弱、能够高度并行化的程序,未能处理数据关联性强的数据(比如树形结构).文中详细讨论了MapReduce的实现机制,提出了一种基于树结构的MapReduce模型,它是基于一种聚类聚合的反复轮询过程,聚合时用<k1,k2,…,kn,value>代替传统的<k,value>,使模型更具有一般性.最后搭建Hadoop平台来处理XML结构的海量数据,并比对新旧两种模型的效率.实验结果表明,其执行速度明显比传统模型高效.
MapReduce是Google開髮的一種併行分佈式計算模型,已在搜索和處理海量數據領域得到瞭廣汎的應用.此模型隻適用于數據關聯性弱、能夠高度併行化的程序,未能處理數據關聯性彊的數據(比如樹形結構).文中詳細討論瞭MapReduce的實現機製,提齣瞭一種基于樹結構的MapReduce模型,它是基于一種聚類聚閤的反複輪詢過程,聚閤時用<k1,k2,…,kn,value>代替傳統的<k,value>,使模型更具有一般性.最後搭建Hadoop平檯來處理XML結構的海量數據,併比對新舊兩種模型的效率.實驗結果錶明,其執行速度明顯比傳統模型高效.
MapReduce시Google개발적일충병행분포식계산모형,이재수색화처리해량수거영역득도료엄범적응용.차모형지괄용우수거관련성약、능구고도병행화적정서,미능처리수거관련성강적수거(비여수형결구).문중상세토론료MapReduce적실현궤제,제출료일충기우수결구적MapReduce모형,타시기우일충취류취합적반복륜순과정,취합시용<k1,k2,…,kn,value>대체전통적<k,value>,사모형경구유일반성.최후탑건Hadoop평태래처리XML결구적해량수거,병비대신구량충모형적효솔.실험결과표명,기집행속도명현비전통모형고효.