山东科技大学学报(自然科学版)
山東科技大學學報(自然科學版)
산동과기대학학보(자연과학판)
JOURNAL OF SHANDONG UNIVERSITY OF SCIENCE AND TECHNOLOGY(NATURAL SCIENCE)
2013年
3期
17-21
,共5页
优势更新%强化学习%好奇心%仿生%机器人
優勢更新%彊化學習%好奇心%倣生%機器人
우세경신%강화학습%호기심%방생%궤기인
针对自平衡机器人运动平衡控制问题,提出了一种基于优势更新的强化学习机制作为机器人的自平衡仿生学习算法.该算法利用优势更新中的基线,结合强化学习中的概率好奇心机制,以一定的概率选择优等行为,剔除劣等行为,从而使机器人在未知环境下可获得像生物一样的自主学习技能,实现机器人的仿生自平衡运动控制.最后,应用该算法对机器人进行自平衡的仿真实验.结果表明,这种基于优势更新的强化学习算法能使机器人获得较强的平衡控制技能,取得了较好的动态性能,体现了机器人的仿生特性.
針對自平衡機器人運動平衡控製問題,提齣瞭一種基于優勢更新的彊化學習機製作為機器人的自平衡倣生學習算法.該算法利用優勢更新中的基線,結閤彊化學習中的概率好奇心機製,以一定的概率選擇優等行為,剔除劣等行為,從而使機器人在未知環境下可穫得像生物一樣的自主學習技能,實現機器人的倣生自平衡運動控製.最後,應用該算法對機器人進行自平衡的倣真實驗.結果錶明,這種基于優勢更新的彊化學習算法能使機器人穫得較彊的平衡控製技能,取得瞭較好的動態性能,體現瞭機器人的倣生特性.
침대자평형궤기인운동평형공제문제,제출료일충기우우세경신적강화학습궤제작위궤기인적자평형방생학습산법.해산법이용우세경신중적기선,결합강화학습중적개솔호기심궤제,이일정적개솔선택우등행위,척제렬등행위,종이사궤기인재미지배경하가획득상생물일양적자주학습기능,실현궤기인적방생자평형운동공제.최후,응용해산법대궤기인진행자평형적방진실험.결과표명,저충기우우세경신적강화학습산법능사궤기인획득교강적평형공제기능,취득료교호적동태성능,체현료궤기인적방생특성.