兵工自动化
兵工自動化
병공자동화
ORDNANCE INDUSTRY AUTOMATION
2007年
7期
54-56
,共3页
蔡文澜%王俊生%税海涛%马宏绪
蔡文瀾%王俊生%稅海濤%馬宏緒
채문란%왕준생%세해도%마굉서
无人直升机%悬停控制%Sarsa增强学习算法%多层前馈神经网络
無人直升機%懸停控製%Sarsa增彊學習算法%多層前饋神經網絡
무인직승궤%현정공제%Sarsa증강학습산법%다층전궤신경망락
无人直升机悬停控制,利用Sarsa增强学习算法设计.将Sarsa增强学习算法与多层前馈神经网络相结合,对控制器参数进行在线调整,实现对微小型无人直升机悬停控制性能的在线优化.增强学习的值函数逼近器采用N10-12-16结构的多层前馈神经网络,权值学习采用直接梯度下降的近似梯度迭代算法,用ε-Greed策略进行行为选择.
無人直升機懸停控製,利用Sarsa增彊學習算法設計.將Sarsa增彊學習算法與多層前饋神經網絡相結閤,對控製器參數進行在線調整,實現對微小型無人直升機懸停控製性能的在線優化.增彊學習的值函數逼近器採用N10-12-16結構的多層前饋神經網絡,權值學習採用直接梯度下降的近似梯度迭代算法,用ε-Greed策略進行行為選擇.
무인직승궤현정공제,이용Sarsa증강학습산법설계.장Sarsa증강학습산법여다층전궤신경망락상결합,대공제기삼수진행재선조정,실현대미소형무인직승궤현정공제성능적재선우화.증강학습적치함수핍근기채용N10-12-16결구적다층전궤신경망락,권치학습채용직접제도하강적근사제도질대산법,용ε-Greed책략진행행위선택.