控制理论与应用
控製理論與應用
공제이론여응용
CONTROL THEORY & APPLICATIONS
2008年
5期
853-856
,共4页
蒋建国%苏兆品%张国富%夏娜
蔣建國%囌兆品%張國富%夏娜
장건국%소조품%장국부%하나
串行多任务%联盟%Agent行为策略%Q-学习
串行多任務%聯盟%Agent行為策略%Q-學習
천행다임무%련맹%Agent행위책략%Q-학습
Agent联盟是多Agent系统中一种重要的合作方式,联盟形成是其研究的关键问题.本文提出一种串行多任务联盟形成中的Agent行为策略,首先论证了Agent合作求解多任务的过程是一个Markov决策过程,然后基于Q-学习求解单个Agent的最优行为策略.实例表明该策略在面向多任务的领域中可以快速、有效地串行形成多个任务求解联盟.
Agent聯盟是多Agent繫統中一種重要的閤作方式,聯盟形成是其研究的關鍵問題.本文提齣一種串行多任務聯盟形成中的Agent行為策略,首先論證瞭Agent閤作求解多任務的過程是一箇Markov決策過程,然後基于Q-學習求解單箇Agent的最優行為策略.實例錶明該策略在麵嚮多任務的領域中可以快速、有效地串行形成多箇任務求解聯盟.
Agent련맹시다Agent계통중일충중요적합작방식,련맹형성시기연구적관건문제.본문제출일충천행다임무련맹형성중적Agent행위책략,수선론증료Agent합작구해다임무적과정시일개Markov결책과정,연후기우Q-학습구해단개Agent적최우행위책략.실례표명해책략재면향다임무적영역중가이쾌속、유효지천행형성다개임무구해련맹.