控制理论与应用
控製理論與應用
공제이론여응용
CONTROL THEORY & APPLICATIONS
2015年
2期
196-201
,共6页
二人零和博弈%策略迭代%博弈代数黎卡提方程
二人零和博弈%策略迭代%博弈代數黎卡提方程
이인령화박혁%책략질대%박혁대수려잡제방정
two-player zero-sum game%policy iterations%game algebraic Riccati equation
针对具有未知动态线性系统的二人零和博弈问题,本文提出了一种新的基于单环迭代方法的在线学习方案.为保证单环迭代方法的收敛性,给出了一种新的分析方法.在系统内部矩阵A,控制输入矩阵B以及干扰输入矩阵D均未知的情况下,通过在线迭代策略,同步得到了博弈代数黎卡提方程的近似解,以及控制和干扰策略.仿真结果表明了所提方法的有效性.
針對具有未知動態線性繫統的二人零和博弈問題,本文提齣瞭一種新的基于單環迭代方法的在線學習方案.為保證單環迭代方法的收斂性,給齣瞭一種新的分析方法.在繫統內部矩陣A,控製輸入矩陣B以及榦擾輸入矩陣D均未知的情況下,通過在線迭代策略,同步得到瞭博弈代數黎卡提方程的近似解,以及控製和榦擾策略.倣真結果錶明瞭所提方法的有效性.
침대구유미지동태선성계통적이인령화박혁문제,본문제출료일충신적기우단배질대방법적재선학습방안.위보증단배질대방법적수렴성,급출료일충신적분석방법.재계통내부구진A,공제수입구진B이급간우수입구진D균미지적정황하,통과재선질대책략,동보득도료박혁대수려잡제방정적근사해,이급공제화간우책략.방진결과표명료소제방법적유효성.