计算机应用与软件
計算機應用與軟件
계산궤응용여연건
COMPUTER APPLICATIONS AND SOFTWARE
2011年
7期
128-131
,共4页
Web服务组合%强化学习%马尔科夫决策过程
Web服務組閤%彊化學習%馬爾科伕決策過程
Web복무조합%강화학습%마이과부결책과정
为了提高服务组合适应动态环境的能力,将强化学习技术引入到Web服务组合.目前常用的强化学习方法有三种:蒙特卡罗、时序差分和Q-Learning,为了发现最适合于服务组合的强化学习方法,对这三种方法进行了对比研究.首先将Web服务组合建模为马尔科夫决策过程,然后介绍了这三种强化学习方法并分析了它们的异同,同时,提出了Web服务组合领域的奖赏值确定方法.最后,通过实验比较了这三种强化学习方法的学习效果,实验结果显示,在Web服务组合应用中,Q-Learning比另外两种方法收敛速度更快,因此更适合执行服务组合.
為瞭提高服務組閤適應動態環境的能力,將彊化學習技術引入到Web服務組閤.目前常用的彊化學習方法有三種:矇特卡囉、時序差分和Q-Learning,為瞭髮現最適閤于服務組閤的彊化學習方法,對這三種方法進行瞭對比研究.首先將Web服務組閤建模為馬爾科伕決策過程,然後介紹瞭這三種彊化學習方法併分析瞭它們的異同,同時,提齣瞭Web服務組閤領域的獎賞值確定方法.最後,通過實驗比較瞭這三種彊化學習方法的學習效果,實驗結果顯示,在Web服務組閤應用中,Q-Learning比另外兩種方法收斂速度更快,因此更適閤執行服務組閤.
위료제고복무조합괄응동태배경적능력,장강화학습기술인입도Web복무조합.목전상용적강화학습방법유삼충:몽특잡라、시서차분화Q-Learning,위료발현최괄합우복무조합적강화학습방법,대저삼충방법진행료대비연구.수선장Web복무조합건모위마이과부결책과정,연후개소료저삼충강화학습방법병분석료타문적이동,동시,제출료Web복무조합영역적장상치학정방법.최후,통과실험비교료저삼충강화학습방법적학습효과,실험결과현시,재Web복무조합응용중,Q-Learning비령외량충방법수렴속도경쾌,인차경괄합집행복무조합.