CAJ | 학술논문

基于近似动态规划(approximate dynamic programming,ADP)对空战飞行器隐蔽接敌决策问题进行研究.基于作战飞行器的战术使用原则,提出了隐蔽接敌过程中的优势区域与暴露区域;构建了基于马尔科夫决策过程(Markov decision process,MDP)的隐蔽接敌策略的强化学习方法;通过态势得分函数对非连续的即时收益函数进行修正,给出了基于ADP方法的策略学习与策略提取方法.分别针对对手在有无信息源支持情况下的不同机动对策进行了仿真验证.仿真结果表明,将ADP方法应用于隐蔽接敌策略的学习是可行的,在不同态势下可获得较为有效的接敌策略.
기우근사동태규화(approximate dynamic programming,ADP)대공전비행기은폐접활결책문제진행연구.기우작전비행기적전술사용원칙,제출료은폐접활과정중적우세구역여폭로구역;구건료기우마이과부결책과정(Markov decision process,MDP)적은폐접활책략적강화학습방법;통과태세득분함수대비련속적즉시수익함수진행수정,급출료기우ADP방법적책략학습여책략제취방법.분별침대대수재유무신식원지지정황하적불동궤동대책진행료방진험증.방진결과표명,장ADP방법응용우은폐접활책략적학습시가행적,재불동태세하가획득교위유효적접활책략.