CAJ | 학술논문

为了表示部分可观察马尔可夫环境下,多Agent决策中各Agent之间的动态结构关系,对影响图(IDs)在结构和时间上进行扩展,形成一种能够对其他Agent建模的决策模型:交互式动态影响图(I-DIDs).I-DIDs是不确定环境下多Agent进行序贯决策的图模型.该模型的解是在对其Agent行为概率分布的预测下提供给该Agent的最优决策,能更有效地解决多Agent的决策问题.但I-DIDs状态空间太大,Agents候选模型空间随着时间片的增加成指数级增长,使计算变得复杂.因此,提出了一种基于行为等价的最小化模型集合的方法,通过限制模型增长来缓解模型空间不断扩大的趋势,以达到简化计算的目的.在模型实例上的仿真实验结果显示了该算法的有效性.
위료표시부분가관찰마이가부배경하,다Agent결책중각Agent지간적동태결구관계,대영향도(IDs)재결구화시간상진행확전,형성일충능구대기타Agent건모적결책모형:교호식동태영향도(I-DIDs).I-DIDs시불학정배경하다Agent진행서관결책적도모형.해모형적해시재대기Agent행위개솔분포적예측하제공급해Agent적최우결책,능경유효지해결다Agent적결책문제.단I-DIDs상태공간태대,Agents후선모형공간수착시간편적증가성지수급증장,사계산변득복잡.인차,제출료일충기우행위등개적최소화모형집합적방법,통과한제모형증장래완해모형공간불단확대적추세,이체도간화계산적목적.재모형실례상적방진실험결과현시료해산법적유효성.