计算机工程与科学
計算機工程與科學
계산궤공정여과학
COMPUTER ENGINEERING & SCIENCE
2011年
12期
72-77
,共6页
强化学习%自适应系统%自适应多Agent系统
彊化學習%自適應繫統%自適應多Agent繫統
강화학습%자괄응계통%자괄응다Agent계통
自适应系统所处的环境往往是不确定的,其变化事先难以预测,如何支持这种环境下复杂自适应系统的开发已经成为软件工程领域面临的一项重要挑战.强化学习是机器学习领域中的一个重要分支,强化学习系统能够通过不断试错的方式,学习环境状态到可执行动作的最优对应策略.本文针对自适应系统环境不确定的问题,将Agent技术与强化学习技术相结合,提出复杂自适应系统开发的核心运行机制和构造技术,从而使得所开发的自适应系统具备在不确定环境下适应环境变化的能力.论文通过案例分析阐述了如何基于学习机制来进行自适应多Agent系统的开发,验证了该机制和方法的有效性.
自適應繫統所處的環境往往是不確定的,其變化事先難以預測,如何支持這種環境下複雜自適應繫統的開髮已經成為軟件工程領域麵臨的一項重要挑戰.彊化學習是機器學習領域中的一箇重要分支,彊化學習繫統能夠通過不斷試錯的方式,學習環境狀態到可執行動作的最優對應策略.本文針對自適應繫統環境不確定的問題,將Agent技術與彊化學習技術相結閤,提齣複雜自適應繫統開髮的覈心運行機製和構造技術,從而使得所開髮的自適應繫統具備在不確定環境下適應環境變化的能力.論文通過案例分析闡述瞭如何基于學習機製來進行自適應多Agent繫統的開髮,驗證瞭該機製和方法的有效性.
자괄응계통소처적배경왕왕시불학정적,기변화사선난이예측,여하지지저충배경하복잡자괄응계통적개발이경성위연건공정영역면림적일항중요도전.강화학습시궤기학습영역중적일개중요분지,강화학습계통능구통과불단시착적방식,학습배경상태도가집행동작적최우대응책략.본문침대자괄응계통배경불학정적문제,장Agent기술여강화학습기술상결합,제출복잡자괄응계통개발적핵심운행궤제화구조기술,종이사득소개발적자괄응계통구비재불학정배경하괄응배경변화적능력.논문통과안례분석천술료여하기우학습궤제래진행자괄응다Agent계통적개발,험증료해궤제화방법적유효성.