CAJ | 학술논문

根据现代战争的对抗格局,提出了空空导弹拦截高速大机动目标的智能制导律.这种制导律是采用基于Q-learning算法的.Q-learning的思想是直接优化一个可迭代计算的Q函数,并利用增强学习实现知识的自动获取,来扩展所能得到的知识资源.在Q-learning算法中,系统通过计算状态的值函数或者状态-动作对的值函数来控制导弹的飞行.根据环境的评价性回报函数来实现决策的优化,从而能够达到行为优化.这种制导规律只需要导弹和目标的位置、状态变量和法向过载的测量量,易于弹上实时实现,并且将这种制导律和传统制导相比较.结果表明:这种制导具有一定的智能行为,可以拦截大机动目标.这种智能制导方法有利于提高打击精度和载机的作战生存能力.
근거현대전쟁적대항격국,제출료공공도탄란절고속대궤동목표적지능제도률.저충제도률시채용기우Q-learning산법적.Q-learning적사상시직접우화일개가질대계산적Q함수,병이용증강학습실현지식적자동획취,래확전소능득도적지식자원.재Q-learning산법중,계통통과계산상태적치함수혹자상태-동작대적치함수래공제도탄적비행.근거배경적평개성회보함수래실현결책적우화,종이능구체도행위우화.저충제도규률지수요도탄화목표적위치、상태변량화법향과재적측량량,역우탄상실시실현,병차장저충제도률화전통제도상비교.결과표명:저충제도구유일정적지능행위,가이란절대궤동목표.저충지능제도방법유리우제고타격정도화재궤적작전생존능력.