CAJ | 학술논문

强化学习一词来自于行为心理学,这门学科把行为学习看成反复试验的过程,从而把环境状态映射成相应的动作.在设计智能机器人过程中,如何来实现行为主义的思想、在与环境的交互中学习行为动作?文中把机器人在未知环境中为躲避障碍所采取的动作看作一种行为,采用强化学习方法来实现智能机器人避碰行为学习.Q-学习算法是类似于动态规划的一种强化学习方法,文中在介绍了Q-学习的基本算法之后,提出了具有竞争思想和自组织机制的Q-学习神经网络学习算法;然后研究了该算法在智能机器人局部路径规划中的应用,在文中的最后给出了详细的仿真结果.
강화학습일사래자우행위심이학,저문학과파행위학습간성반복시험적과정,종이파배경상태영사성상응적동작.재설계지능궤기인과정중,여하래실현행위주의적사상、재여배경적교호중학습행위동작?문중파궤기인재미지배경중위타피장애소채취적동작간작일충행위,채용강화학습방법래실현지능궤기인피팽행위학습.Q-학습산법시유사우동태규화적일충강화학습방법,문중재개소료Q-학습적기본산법지후,제출료구유경쟁사상화자조직궤제적Q-학습신경망락학습산법;연후연구료해산법재지능궤기인국부로경규화중적응용,재문중적최후급출료상세적방진결과.