计算机测量与控制
計算機測量與控製
계산궤측량여공제
COMPUTER MEASUREMENT & CONTROL
2012年
11期
3063-3065
,共3页
增强学习控制器%仿生水下机器人%姿态镇定
增彊學習控製器%倣生水下機器人%姿態鎮定
증강학습공제기%방생수하궤기인%자태진정
仿生水下机器人是水下机器人领域的一个重要研究方向;利用增强学习控制器对仿生水下机器人的姿态镇定问题进行了研究;增强学习控制器主要由回报函数、学习样本数据库、神经网络、动作选择以及Q学习算法等模块构成,可通过直接与环境交互生成最优动作选择策略;镇定仿生水下机器人的偏航角姿态镇定的仿真试验表明,增强学习控制器在偏航角姿态镇定方面的性能较为理想;学习样本数据库的引入显著提升了增强学习控制器的姿态镇定性能;学习样本数据库的容量对学习性能存在较大影响.
倣生水下機器人是水下機器人領域的一箇重要研究方嚮;利用增彊學習控製器對倣生水下機器人的姿態鎮定問題進行瞭研究;增彊學習控製器主要由迴報函數、學習樣本數據庫、神經網絡、動作選擇以及Q學習算法等模塊構成,可通過直接與環境交互生成最優動作選擇策略;鎮定倣生水下機器人的偏航角姿態鎮定的倣真試驗錶明,增彊學習控製器在偏航角姿態鎮定方麵的性能較為理想;學習樣本數據庫的引入顯著提升瞭增彊學習控製器的姿態鎮定性能;學習樣本數據庫的容量對學習性能存在較大影響.
방생수하궤기인시수하궤기인영역적일개중요연구방향;이용증강학습공제기대방생수하궤기인적자태진정문제진행료연구;증강학습공제기주요유회보함수、학습양본수거고、신경망락、동작선택이급Q학습산법등모괴구성,가통과직접여배경교호생성최우동작선택책략;진정방생수하궤기인적편항각자태진정적방진시험표명,증강학습공제기재편항각자태진정방면적성능교위이상;학습양본수거고적인입현저제승료증강학습공제기적자태진정성능;학습양본수거고적용량대학습성능존재교대영향.