解放军理工大学学报(自然科学版)
解放軍理工大學學報(自然科學版)
해방군리공대학학보(자연과학판)
JOURNAL OF PLA UNIVERSITY OF SCIENCE AND TECHNOLOGY(NATURAL SCIENCE EDITION)
2011年
2期
119-124
,共6页
多Agent决策%交互式动态影响图%行为等价%最小模型更新集
多Agent決策%交互式動態影響圖%行為等價%最小模型更新集
다Agent결책%교호식동태영향도%행위등개%최소모형경신집
为了表示部分可观察马尔可夫环境下,多Agent决策中各Agent之间的动态结构关系,对影响图(IDs)在结构和时间上进行扩展,形成一种能够对其他Agent建模的决策模型:交互式动态影响图(I-DIDs).I-DIDs是不确定环境下多Agent进行序贯决策的图模型.该模型的解是在对其Agent行为概率分布的预测下提供给该Agent的最优决策,能更有效地解决多Agent的决策问题.但I-DIDs状态空间太大,Agents候选模型空间随着时间片的增加成指数级增长,使计算变得复杂.因此,提出了一种基于行为等价的最小化模型集合的方法,通过限制模型增长来缓解模型空间不断扩大的趋势,以达到简化计算的目的.在模型实例上的仿真实验结果显示了该算法的有效性.
為瞭錶示部分可觀察馬爾可伕環境下,多Agent決策中各Agent之間的動態結構關繫,對影響圖(IDs)在結構和時間上進行擴展,形成一種能夠對其他Agent建模的決策模型:交互式動態影響圖(I-DIDs).I-DIDs是不確定環境下多Agent進行序貫決策的圖模型.該模型的解是在對其Agent行為概率分佈的預測下提供給該Agent的最優決策,能更有效地解決多Agent的決策問題.但I-DIDs狀態空間太大,Agents候選模型空間隨著時間片的增加成指數級增長,使計算變得複雜.因此,提齣瞭一種基于行為等價的最小化模型集閤的方法,通過限製模型增長來緩解模型空間不斷擴大的趨勢,以達到簡化計算的目的.在模型實例上的倣真實驗結果顯示瞭該算法的有效性.
위료표시부분가관찰마이가부배경하,다Agent결책중각Agent지간적동태결구관계,대영향도(IDs)재결구화시간상진행확전,형성일충능구대기타Agent건모적결책모형:교호식동태영향도(I-DIDs).I-DIDs시불학정배경하다Agent진행서관결책적도모형.해모형적해시재대기Agent행위개솔분포적예측하제공급해Agent적최우결책,능경유효지해결다Agent적결책문제.단I-DIDs상태공간태대,Agents후선모형공간수착시간편적증가성지수급증장,사계산변득복잡.인차,제출료일충기우행위등개적최소화모형집합적방법,통과한제모형증장래완해모형공간불단확대적추세,이체도간화계산적목적.재모형실례상적방진실험결과현시료해산법적유효성.