弹箭与制导学报
彈箭與製導學報
탄전여제도학보
JOURNAL OF PROJECTILES, ROCKETS, MISSILES AND GUIDANCE
2008年
2期
73-76
,共4页
蔡文澜%王俊生%税海涛%马宏绪%黄茜薇
蔡文瀾%王俊生%稅海濤%馬宏緒%黃茜薇
채문란%왕준생%세해도%마굉서%황천미
无人直升机%增强学习%自适应启发评价%策略梯度%PEGASUS
無人直升機%增彊學習%自適應啟髮評價%策略梯度%PEGASUS
무인직승궤%증강학습%자괄응계발평개%책략제도%PEGASUS
自适应启发评价(AHC)增强学习结构分别逼近马尔可夫决策过程的值函数和策略函数,策略梯度增强学习能够将随机不确定的马尔可夫决策过程转换为确定性的马尔可夫决策过程.通过将AHC增强学习和策略梯度增强学习相结合,对PID控制器参数进行在线自适应整定,实现对无人直升机姿态控制性能的在线优化.仿真结果表明,与固定PID参数控制器相比,该算法能在线调整控制器参数,并很好地控制了无人直升机的悬停姿态.
自適應啟髮評價(AHC)增彊學習結構分彆逼近馬爾可伕決策過程的值函數和策略函數,策略梯度增彊學習能夠將隨機不確定的馬爾可伕決策過程轉換為確定性的馬爾可伕決策過程.通過將AHC增彊學習和策略梯度增彊學習相結閤,對PID控製器參數進行在線自適應整定,實現對無人直升機姿態控製性能的在線優化.倣真結果錶明,與固定PID參數控製器相比,該算法能在線調整控製器參數,併很好地控製瞭無人直升機的懸停姿態.
자괄응계발평개(AHC)증강학습결구분별핍근마이가부결책과정적치함수화책략함수,책략제도증강학습능구장수궤불학정적마이가부결책과정전환위학정성적마이가부결책과정.통과장AHC증강학습화책략제도증강학습상결합,대PID공제기삼수진행재선자괄응정정,실현대무인직승궤자태공제성능적재선우화.방진결과표명,여고정PID삼수공제기상비,해산법능재선조정공제기삼수,병흔호지공제료무인직승궤적현정자태.