哈尔滨工程大学学报
哈爾濱工程大學學報
합이빈공정대학학보
JOURNAL OF HARBIN ENGINEERING UNIVERSITY
1999年
5期
77-82
,共6页
Q-learning%机器人%神经网络
Q-learning%機器人%神經網絡
Q-learning%궤기인%신경망락
首先介绍了基于表格Q-learning的方法,然后提出了一种用神经网络实现的Q-learning方法,利用这种方法实现机器人避碰行为学习,并进行了仿真试验.最后讨论了提高强化学习速度的方法.
首先介紹瞭基于錶格Q-learning的方法,然後提齣瞭一種用神經網絡實現的Q-learning方法,利用這種方法實現機器人避踫行為學習,併進行瞭倣真試驗.最後討論瞭提高彊化學習速度的方法.
수선개소료기우표격Q-learning적방법,연후제출료일충용신경망락실현적Q-learning방법,이용저충방법실현궤기인피팽행위학습,병진행료방진시험.최후토론료제고강화학습속도적방법.