哈尔滨工程大学学报
哈爾濱工程大學學報
합이빈공정대학학보
JOURNAL OF HARBIN ENGINEERING UNIVERSITY
2005年
5期
586-590,613
,共6页
强化学习%多机器人%行为融合
彊化學習%多機器人%行為融閤
강화학습%다궤기인%행위융합
介绍了一种基于先验知识的强化学习方法,它将传统的规则控制方法和强化学习方法相结合,在保留了已知的部分规则的情况下,利用强化学习方法对基本行为的融合机制进行了完善;同时,利用已知的规则知识对学习器进行指导,保证了学习向正确方向进行,有利于学习收敛速度的提高.文章给出了2种实现方法的结合方式,并给出了学习器的结构及参数和函数设定.最后以机器人围捕为研究背景,实现了移动机器人的自适应式行为融合,并利用仿真实验对其有效性进行验证.结果表明该方法具有收敛快、学习效果好的特点.
介紹瞭一種基于先驗知識的彊化學習方法,它將傳統的規則控製方法和彊化學習方法相結閤,在保留瞭已知的部分規則的情況下,利用彊化學習方法對基本行為的融閤機製進行瞭完善;同時,利用已知的規則知識對學習器進行指導,保證瞭學習嚮正確方嚮進行,有利于學習收斂速度的提高.文章給齣瞭2種實現方法的結閤方式,併給齣瞭學習器的結構及參數和函數設定.最後以機器人圍捕為研究揹景,實現瞭移動機器人的自適應式行為融閤,併利用倣真實驗對其有效性進行驗證.結果錶明該方法具有收斂快、學習效果好的特點.
개소료일충기우선험지식적강화학습방법,타장전통적규칙공제방법화강화학습방법상결합,재보류료이지적부분규칙적정황하,이용강화학습방법대기본행위적융합궤제진행료완선;동시,이용이지적규칙지식대학습기진행지도,보증료학습향정학방향진행,유리우학습수렴속도적제고.문장급출료2충실현방법적결합방식,병급출료학습기적결구급삼수화함수설정.최후이궤기인위포위연구배경,실현료이동궤기인적자괄응식행위융합,병이용방진실험대기유효성진행험증.결과표명해방법구유수렴쾌、학습효과호적특점.