计算机与现代化
計算機與現代化
계산궤여현대화
COMPUTER AND MODERNIZATION
2015年
8期
80-83,88
,共5页
祁鹏年%朱晋%郝君慧%许丰平
祁鵬年%硃晉%郝君慧%許豐平
기붕년%주진%학군혜%허봉평
Hadoop%性能优化%推测执行算法
Hadoop%性能優化%推測執行算法
Hadoop%성능우화%추측집행산법
Hadoop%performance optimization%speculation execution algorithm
研究和分析Hadoop推测执行算法在异构环境下性能较差的问题,在深入研究源码的基础上提出改进算法。该算法根据系统负载情况自动调节后备任务的执行,实现系统负载均衡。采用Zaharia提出的历史平均剩余完成时间来估计剩余时间,并使用剩余时间值大于20%的方法来判断掉队者,进而得到更精确的掉队者队列。该算法在一定程度上提高了异构环境中推测执行的性能。
研究和分析Hadoop推測執行算法在異構環境下性能較差的問題,在深入研究源碼的基礎上提齣改進算法。該算法根據繫統負載情況自動調節後備任務的執行,實現繫統負載均衡。採用Zaharia提齣的歷史平均剩餘完成時間來估計剩餘時間,併使用剩餘時間值大于20%的方法來判斷掉隊者,進而得到更精確的掉隊者隊列。該算法在一定程度上提高瞭異構環境中推測執行的性能。
연구화분석Hadoop추측집행산법재이구배경하성능교차적문제,재심입연구원마적기출상제출개진산법。해산법근거계통부재정황자동조절후비임무적집행,실현계통부재균형。채용Zaharia제출적역사평균잉여완성시간래고계잉여시간,병사용잉여시간치대우20%적방법래판단도대자,진이득도경정학적도대자대렬。해산법재일정정도상제고료이구배경중추측집행적성능。
This article researches and analyzes the poor performance of the Hadoop speculation execution algorithm in heterogene-ous environments, and puts forward a new improvement algorithm after researching source code deeply.The new algorithm can adjust the execution of backup task automatically to make it balanced according to system load condition, and get more precise stragglers queues using the way of putting the residual time value greater than 0.2 in task queue to judge the stragglers, based on the historical average completion time proposed by Zaharia.The new algorithm to a certain extent improves the performance of speculation execution in the heterogeneous environments.