CAJ | 학술논문

万方数据

控制理论与应用 공제이론여응용
CONTROL THEORY & APPLICATIONS
2007年 2期 317-321 ,共5页

宋梅萍%顾国昌%张国印%刘海波宋梅萍%顧國昌%張國印%劉海波

송매평%고국창%장국인%류해파

多agent学习%一般和随机博弈%Nash平衡%Pareto占优%Q-学习多agent學習%一般和隨機博弈%Nash平衡%Pareto佔優%Q-學習
다agent학습%일반화수궤박혁%Nash평형%Pareto점우%Q-학습

理性和收敛是多agent学习研究所追求的目标.在理性合作的多agent系统中提出利用Pareto占优解代替非合作的Nash平衡解进行学习,使agent更具理性.另一方面引入社会公约来启动和约束agent的推理,统一系统中所有agent的决策,从而保证学习的收敛性.利用2人栅格游戏对多种算法进行验证,成功率的比较说明了所提算法具有较好的学习性能.
이성화수렴시다agent학습연구소추구적목표.재이성합작적다agent계통중제출이용Pareto점우해대체비합작적Nash평형해진행학습,사agent경구이성.령일방면인입사회공약래계동화약속agent적추리,통일계통중소유agent적결책,종이보증학습적수렴성.이용2인책격유희대다충산법진행험증,성공솔적비교설명료소제산법구유교호적학습성능.