系统工程与电子技术
繫統工程與電子技術
계통공정여전자기술
SYSTEMS ENGINEERING AND ELECTRONICS
2011年
5期
1063-1068
,共6页
徐安%于雷%寇英信%徐保伟%李战武
徐安%于雷%寇英信%徐保偉%李戰武
서안%우뢰%구영신%서보위%리전무
隐蔽接敌%马尔科夫决策过程%近似动态规划%空战决策%近似值函数
隱蔽接敵%馬爾科伕決策過程%近似動態規劃%空戰決策%近似值函數
은폐접활%마이과부결책과정%근사동태규화%공전결책%근사치함수
基于近似动态规划(approximate dynamic programming,ADP)对空战飞行器隐蔽接敌决策问题进行研究.基于作战飞行器的战术使用原则,提出了隐蔽接敌过程中的优势区域与暴露区域;构建了基于马尔科夫决策过程(Markov decision process,MDP)的隐蔽接敌策略的强化学习方法;通过态势得分函数对非连续的即时收益函数进行修正,给出了基于ADP方法的策略学习与策略提取方法.分别针对对手在有无信息源支持情况下的不同机动对策进行了仿真验证.仿真结果表明,将ADP方法应用于隐蔽接敌策略的学习是可行的,在不同态势下可获得较为有效的接敌策略.
基于近似動態規劃(approximate dynamic programming,ADP)對空戰飛行器隱蔽接敵決策問題進行研究.基于作戰飛行器的戰術使用原則,提齣瞭隱蔽接敵過程中的優勢區域與暴露區域;構建瞭基于馬爾科伕決策過程(Markov decision process,MDP)的隱蔽接敵策略的彊化學習方法;通過態勢得分函數對非連續的即時收益函數進行脩正,給齣瞭基于ADP方法的策略學習與策略提取方法.分彆針對對手在有無信息源支持情況下的不同機動對策進行瞭倣真驗證.倣真結果錶明,將ADP方法應用于隱蔽接敵策略的學習是可行的,在不同態勢下可穫得較為有效的接敵策略.
기우근사동태규화(approximate dynamic programming,ADP)대공전비행기은폐접활결책문제진행연구.기우작전비행기적전술사용원칙,제출료은폐접활과정중적우세구역여폭로구역;구건료기우마이과부결책과정(Markov decision process,MDP)적은폐접활책략적강화학습방법;통과태세득분함수대비련속적즉시수익함수진행수정,급출료기우ADP방법적책략학습여책략제취방법.분별침대대수재유무신식원지지정황하적불동궤동대책진행료방진험증.방진결과표명,장ADP방법응용우은폐접활책략적학습시가행적,재불동태세하가획득교위유효적접활책략.