计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2008年
23期
46-48
,共3页
多智能体%增强学习%机器人世界杯足球锦标赛
多智能體%增彊學習%機器人世界杯足毬錦標賽
다지능체%증강학습%궤기인세계배족구금표새
针对非确定马尔可夫环境下的多智能体系统,提出了多智能体Q学习模型和算法.算法中通过对联合动作的统计来学习其它智能体的行为策略,并利用智能体策略向量的全概率分布保证了对联合最优动作的选择.在实验中,成功实现了智能体的决策,提高了AFU队的整体的对抗能力,证明了算法的有效性和可行性.
針對非確定馬爾可伕環境下的多智能體繫統,提齣瞭多智能體Q學習模型和算法.算法中通過對聯閤動作的統計來學習其它智能體的行為策略,併利用智能體策略嚮量的全概率分佈保證瞭對聯閤最優動作的選擇.在實驗中,成功實現瞭智能體的決策,提高瞭AFU隊的整體的對抗能力,證明瞭算法的有效性和可行性.
침대비학정마이가부배경하적다지능체계통,제출료다지능체Q학습모형화산법.산법중통과대연합동작적통계래학습기타지능체적행위책략,병이용지능체책략향량적전개솔분포보증료대연합최우동작적선택.재실험중,성공실현료지능체적결책,제고료AFU대적정체적대항능력,증명료산법적유효성화가행성.