CAJ | 학술논문

介绍了一种基于先验知识的强化学习方法,它将传统的规则控制方法和强化学习方法相结合,在保留了已知的部分规则的情况下,利用强化学习方法对基本行为的融合机制进行了完善;同时,利用已知的规则知识对学习器进行指导,保证了学习向正确方向进行,有利于学习收敛速度的提高.文章给出了2种实现方法的结合方式,并给出了学习器的结构及参数和函数设定.最后以机器人围捕为研究背景,实现了移动机器人的自适应式行为融合,并利用仿真实验对其有效性进行验证.结果表明该方法具有收敛快、学习效果好的特点.
개소료일충기우선험지식적강화학습방법,타장전통적규칙공제방법화강화학습방법상결합,재보류료이지적부분규칙적정황하,이용강화학습방법대기본행위적융합궤제진행료완선;동시,이용이지적규칙지식대학습기진행지도,보증료학습향정학방향진행,유리우학습수렴속도적제고.문장급출료2충실현방법적결합방식,병급출료학습기적결구급삼수화함수설정.최후이궤기인위포위연구배경,실현료이동궤기인적자괄응식행위융합,병이용방진실험대기유효성진행험증.결과표명해방법구유수렴쾌、학습효과호적특점.