CAJ | 학술논문

간체로 보기 번체로 보기

具有未知动态的线性系统二人零和博弈问题在线学习方案
구유미지동태적선성계통이인령화박혁문제재선학습방안
Online solution of two-player zero-sum games for linear systems with unknown dynamics

万方数据

控制理论与应用控製理論與應用 공제이론여응용
CONTROL THEORY & APPLICATIONS
2015年 2期 196-201 ,共6页

富月%柴天佑富月%柴天祐

부월%시천우

二人零和博弈%策略迭代%博弈代数黎卡提方程二人零和博弈%策略迭代%博弈代數黎卡提方程
이인령화박혁%책략질대%박혁대수려잡제방정
two-player zero-sum game%policy iterations%game algebraic Riccati equation

针对具有未知动态线性系统的二人零和博弈问题,本文提出了一种新的基于单环迭代方法的在线学习方案.为保证单环迭代方法的收敛性,给出了一种新的分析方法.在系统内部矩阵A,控制输入矩阵B以及干扰输入矩阵D均未知的情况下,通过在线迭代策略,同步得到了博弈代数黎卡提方程的近似解,以及控制和干扰策略.仿真结果表明了所提方法的有效性.
침대구유미지동태선성계통적이인령화박혁문제,본문제출료일충신적기우단배질대방법적재선학습방안.위보증단배질대방법적수렴성,급출료일충신적분석방법.재계통내부구진A,공제수입구진B이급간우수입구진D균미지적정황하,통과재선질대책략,동보득도료박혁대수려잡제방정적근사해,이급공제화간우책략.방진결과표명료소제방법적유효성.