控制理论与应用
控製理論與應用
공제이론여응용
CONTROL THEORY & APPLICATIONS
2007年
2期
317-321
,共5页
宋梅萍%顾国昌%张国印%刘海波
宋梅萍%顧國昌%張國印%劉海波
송매평%고국창%장국인%류해파
多agent学习%一般和随机博弈%Nash平衡%Pareto占优%Q-学习
多agent學習%一般和隨機博弈%Nash平衡%Pareto佔優%Q-學習
다agent학습%일반화수궤박혁%Nash평형%Pareto점우%Q-학습
理性和收敛是多agent学习研究所追求的目标.在理性合作的多agent系统中提出利用Pareto占优解代替非合作的Nash平衡解进行学习,使agent更具理性.另一方面引入社会公约来启动和约束agent的推理,统一系统中所有agent的决策,从而保证学习的收敛性.利用2人栅格游戏对多种算法进行验证,成功率的比较说明了所提算法具有较好的学习性能.
理性和收斂是多agent學習研究所追求的目標.在理性閤作的多agent繫統中提齣利用Pareto佔優解代替非閤作的Nash平衡解進行學習,使agent更具理性.另一方麵引入社會公約來啟動和約束agent的推理,統一繫統中所有agent的決策,從而保證學習的收斂性.利用2人柵格遊戲對多種算法進行驗證,成功率的比較說明瞭所提算法具有較好的學習性能.
이성화수렴시다agent학습연구소추구적목표.재이성합작적다agent계통중제출이용Pareto점우해대체비합작적Nash평형해진행학습,사agent경구이성.령일방면인입사회공약래계동화약속agent적추리,통일계통중소유agent적결책,종이보증학습적수렴성.이용2인책격유희대다충산법진행험증,성공솔적비교설명료소제산법구유교호적학습성능.