控制与决策
控製與決策
공제여결책
CONTROL AND DECISION
2005年
10期
1081-1090
,共10页
多agent系统%随机博弈%强化学习
多agent繫統%隨機博弈%彊化學習
다agent계통%수궤박혁%강화학습
多agent学习是在随机博弈的框架下,研究多个智能体间通过自学习掌握交互技巧的问题.单agent强化学习方法研究的成功,对策论本身牢固的数学基础以及在复杂任务环境中广阔的应用前景,使得多agent强化学习成为目前机器学习研究领域的一个重要课题.首先介绍了多agent系统随机博弈中基本概念的形式定义;然后介绍了随机博弈和重复博弈中学习算法的研究以及其他相关工作;最后结合近年来的发展,综述了多agent学习在电子商务、机器人以及军事等方面的应用研究,并介绍了仍存在的问题和未来的研究方向.
多agent學習是在隨機博弈的框架下,研究多箇智能體間通過自學習掌握交互技巧的問題.單agent彊化學習方法研究的成功,對策論本身牢固的數學基礎以及在複雜任務環境中廣闊的應用前景,使得多agent彊化學習成為目前機器學習研究領域的一箇重要課題.首先介紹瞭多agent繫統隨機博弈中基本概唸的形式定義;然後介紹瞭隨機博弈和重複博弈中學習算法的研究以及其他相關工作;最後結閤近年來的髮展,綜述瞭多agent學習在電子商務、機器人以及軍事等方麵的應用研究,併介紹瞭仍存在的問題和未來的研究方嚮.
다agent학습시재수궤박혁적광가하,연구다개지능체간통과자학습장악교호기교적문제.단agent강화학습방법연구적성공,대책론본신뢰고적수학기출이급재복잡임무배경중엄활적응용전경,사득다agent강화학습성위목전궤기학습연구영역적일개중요과제.수선개소료다agent계통수궤박혁중기본개념적형식정의;연후개소료수궤박혁화중복박혁중학습산법적연구이급기타상관공작;최후결합근년래적발전,종술료다agent학습재전자상무、궤기인이급군사등방면적응용연구,병개소료잉존재적문제화미래적연구방향.