CAJ | 학술논문

多agent学习是在随机博弈的框架下,研究多个智能体间通过自学习掌握交互技巧的问题.单agent强化学习方法研究的成功,对策论本身牢固的数学基础以及在复杂任务环境中广阔的应用前景,使得多agent强化学习成为目前机器学习研究领域的一个重要课题.首先介绍了多agent系统随机博弈中基本概念的形式定义;然后介绍了随机博弈和重复博弈中学习算法的研究以及其他相关工作;最后结合近年来的发展,综述了多agent学习在电子商务、机器人以及军事等方面的应用研究,并介绍了仍存在的问题和未来的研究方向.
다agent학습시재수궤박혁적광가하,연구다개지능체간통과자학습장악교호기교적문제.단agent강화학습방법연구적성공,대책론본신뢰고적수학기출이급재복잡임무배경중엄활적응용전경,사득다agent강화학습성위목전궤기학습연구영역적일개중요과제.수선개소료다agent계통수궤박혁중기본개념적형식정의;연후개소료수궤박혁화중복박혁중학습산법적연구이급기타상관공작;최후결합근년래적발전,종술료다agent학습재전자상무、궤기인이급군사등방면적응용연구,병개소료잉존재적문제화미래적연구방향.