福建电脑
福建電腦
복건전뇌
FUJIAN COMPUTER
2015年
5期
92-93,47
,共3页
多Agent%强化学习%对策论%POMDP
多Agent%彊化學習%對策論%POMDP
다Agent%강화학습%대책론%POMDP
强化学习是Agent通过试错与环境交互改进动作策略,单Agent强化学习能够进行自学习和在线学习,单Agent的知识和资源是有限的,多个Agent强化学习是求解复杂问题的有效途径。多Agent系统比单Agent具有更强的问题求解能力,但多Agent的参与又增加了问题的复杂性。本文分析了多Agent强化学习方法的研究现状,总结了目前存在的主要问题及其解决方法,最后介绍了多Agent技术在实际问题中的部分应用。
彊化學習是Agent通過試錯與環境交互改進動作策略,單Agent彊化學習能夠進行自學習和在線學習,單Agent的知識和資源是有限的,多箇Agent彊化學習是求解複雜問題的有效途徑。多Agent繫統比單Agent具有更彊的問題求解能力,但多Agent的參與又增加瞭問題的複雜性。本文分析瞭多Agent彊化學習方法的研究現狀,總結瞭目前存在的主要問題及其解決方法,最後介紹瞭多Agent技術在實際問題中的部分應用。
강화학습시Agent통과시착여배경교호개진동작책략,단Agent강화학습능구진행자학습화재선학습,단Agent적지식화자원시유한적,다개Agent강화학습시구해복잡문제적유효도경。다Agent계통비단Agent구유경강적문제구해능력,단다Agent적삼여우증가료문제적복잡성。본문분석료다Agent강화학습방법적연구현상,총결료목전존재적주요문제급기해결방법,최후개소료다Agent기술재실제문제중적부분응용。