战术导弹控制技术
戰術導彈控製技術
전술도탄공제기술
CONTROL TECHNOLOGY OF TACTICAL MISSILE
2006年
4期
19-22,76
,共5页
微分对策%机器学习%Q-learning%BP神经元网络%精确制导
微分對策%機器學習%Q-learning%BP神經元網絡%精確製導
미분대책%궤기학습%Q-learning%BP신경원망락%정학제도
根据现代战争的对抗格局,提出了空空导弹拦截高速大机动目标的智能制导律.这种制导律是采用基于Q-learning算法的.Q-learning的思想是直接优化一个可迭代计算的Q函数,并利用增强学习实现知识的自动获取,来扩展所能得到的知识资源.在Q-learning算法中,系统通过计算状态的值函数或者状态-动作对的值函数来控制导弹的飞行.根据环境的评价性回报函数来实现决策的优化,从而能够达到行为优化.这种制导规律只需要导弹和目标的位置、状态变量和法向过载的测量量,易于弹上实时实现,并且将这种制导律和传统制导相比较.结果表明:这种制导具有一定的智能行为,可以拦截大机动目标.这种智能制导方法有利于提高打击精度和载机的作战生存能力.
根據現代戰爭的對抗格跼,提齣瞭空空導彈攔截高速大機動目標的智能製導律.這種製導律是採用基于Q-learning算法的.Q-learning的思想是直接優化一箇可迭代計算的Q函數,併利用增彊學習實現知識的自動穫取,來擴展所能得到的知識資源.在Q-learning算法中,繫統通過計算狀態的值函數或者狀態-動作對的值函數來控製導彈的飛行.根據環境的評價性迴報函數來實現決策的優化,從而能夠達到行為優化.這種製導規律隻需要導彈和目標的位置、狀態變量和法嚮過載的測量量,易于彈上實時實現,併且將這種製導律和傳統製導相比較.結果錶明:這種製導具有一定的智能行為,可以攔截大機動目標.這種智能製導方法有利于提高打擊精度和載機的作戰生存能力.
근거현대전쟁적대항격국,제출료공공도탄란절고속대궤동목표적지능제도률.저충제도률시채용기우Q-learning산법적.Q-learning적사상시직접우화일개가질대계산적Q함수,병이용증강학습실현지식적자동획취,래확전소능득도적지식자원.재Q-learning산법중,계통통과계산상태적치함수혹자상태-동작대적치함수래공제도탄적비행.근거배경적평개성회보함수래실현결책적우화,종이능구체도행위우화.저충제도규률지수요도탄화목표적위치、상태변량화법향과재적측량량,역우탄상실시실현,병차장저충제도률화전통제도상비교.결과표명:저충제도구유일정적지능행위,가이란절대궤동목표.저충지능제도방법유리우제고타격정도화재궤적작전생존능력.