CAJ | 학술논문

针对自平衡机器人运动平衡控制问题,提出了一种基于优势更新的强化学习机制作为机器人的自平衡仿生学习算法.该算法利用优势更新中的基线,结合强化学习中的概率好奇心机制,以一定的概率选择优等行为,剔除劣等行为,从而使机器人在未知环境下可获得像生物一样的自主学习技能,实现机器人的仿生自平衡运动控制.最后,应用该算法对机器人进行自平衡的仿真实验.结果表明,这种基于优势更新的强化学习算法能使机器人获得较强的平衡控制技能,取得了较好的动态性能,体现了机器人的仿生特性.
침대자평형궤기인운동평형공제문제,제출료일충기우우세경신적강화학습궤제작위궤기인적자평형방생학습산법.해산법이용우세경신중적기선,결합강화학습중적개솔호기심궤제,이일정적개솔선택우등행위,척제렬등행위,종이사궤기인재미지배경하가획득상생물일양적자주학습기능,실현궤기인적방생자평형운동공제.최후,응용해산법대궤기인진행자평형적방진실험.결과표명,저충기우우세경신적강화학습산법능사궤기인획득교강적평형공제기능,취득료교호적동태성능,체현료궤기인적방생특성.