CAJ | 학술논문

仿生水下机器人是水下机器人领域的一个重要研究方向；利用增强学习控制器对仿生水下机器人的姿态镇定问题进行了研究；增强学习控制器主要由回报函数、学习样本数据库、神经网络、动作选择以及Q学习算法等模块构成,可通过直接与环境交互生成最优动作选择策略；镇定仿生水下机器人的偏航角姿态镇定的仿真试验表明,增强学习控制器在偏航角姿态镇定方面的性能较为理想；学习样本数据库的引入显著提升了增强学习控制器的姿态镇定性能；学习样本数据库的容量对学习性能存在较大影响.
방생수하궤기인시수하궤기인영역적일개중요연구방향；이용증강학습공제기대방생수하궤기인적자태진정문제진행료연구；증강학습공제기주요유회보함수、학습양본수거고、신경망락、동작선택이급Q학습산법등모괴구성,가통과직접여배경교호생성최우동작선택책략；진정방생수하궤기인적편항각자태진정적방진시험표명,증강학습공제기재편항각자태진정방면적성능교위이상；학습양본수거고적인입현저제승료증강학습공제기적자태진정성능；학습양본수거고적용량대학습성능존재교대영향.