计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2008年
26期
62-64,213
,共4页
多Agent系统%协作%量子计算%Q-学习%均衡解
多Agent繫統%協作%量子計算%Q-學習%均衡解
다Agent계통%협작%양자계산%Q-학습%균형해
针对多Agent协作强化学习中存在的行为和状态维数灾问题,以及行为选择上存在多个均衡解,为了收敛到最佳均衡解需要搜索策略空间和协调策略选择问题,提出了一种新颖的基于量子理论的多Agent协作学习算法.新算法借签了量子计算理论,将多Agent的行为和状态空间通过量子叠加态表示,利用量子纠缠态来协调策略选择,利用概率振幅表示行为选择概率,并用量子搜索算法来加速多Agent的学习.相应的仿真实验结果显示新算法的有效性.
針對多Agent協作彊化學習中存在的行為和狀態維數災問題,以及行為選擇上存在多箇均衡解,為瞭收斂到最佳均衡解需要搜索策略空間和協調策略選擇問題,提齣瞭一種新穎的基于量子理論的多Agent協作學習算法.新算法藉籤瞭量子計算理論,將多Agent的行為和狀態空間通過量子疊加態錶示,利用量子糾纏態來協調策略選擇,利用概率振幅錶示行為選擇概率,併用量子搜索算法來加速多Agent的學習.相應的倣真實驗結果顯示新算法的有效性.
침대다Agent협작강화학습중존재적행위화상태유수재문제,이급행위선택상존재다개균형해,위료수렴도최가균형해수요수색책략공간화협조책략선택문제,제출료일충신영적기우양자이론적다Agent협작학습산법.신산법차첨료양자계산이론,장다Agent적행위화상태공간통과양자첩가태표시,이용양자규전태래협조책략선택,이용개솔진폭표시행위선택개솔,병용양자수색산법래가속다Agent적학습.상응적방진실험결과현시신산법적유효성.