CAJ | 학술논문

간체로 보기 번체로 보기

多任务联盟形成中的Agent行为策略研究
다임무련맹형성중적Agent행위책략연구
Agent-behavior strategy in serial multi-task coalition formation

万方数据

控制理论与应用控製理論與應用 공제이론여응용
CONTROL THEORY & APPLICATIONS
2008年 5期 853-856 ,共4页

蒋建国%苏兆品%张国富%夏娜蔣建國%囌兆品%張國富%夏娜

장건국%소조품%장국부%하나

串行多任务%联盟%Agent行为策略%Q-学习串行多任務%聯盟%Agent行為策略%Q-學習
천행다임무%련맹%Agent행위책략%Q-학습

Agent联盟是多Agent系统中一种重要的合作方式,联盟形成是其研究的关键问题.本文提出一种串行多任务联盟形成中的Agent行为策略,首先论证了Agent合作求解多任务的过程是一个Markov决策过程,然后基于Q-学习求解单个Agent的最优行为策略.实例表明该策略在面向多任务的领域中可以快速、有效地串行形成多个任务求解联盟.
Agent련맹시다Agent계통중일충중요적합작방식,련맹형성시기연구적관건문제.본문제출일충천행다임무련맹형성중적Agent행위책략,수선론증료Agent합작구해다임무적과정시일개Markov결책과정,연후기우Q-학습구해단개Agent적최우행위책략.실례표명해책략재면향다임무적영역중가이쾌속、유효지천행형성다개임무구해련맹.