CAJ | 학술논문

针对现有移动机器人模糊导航对未知不确定环境缺乏自适应性的缺点,提出了一种具备在线自学习能力的模糊导航方法.通过设计模糊规则并确定动作先验值,完成初始模糊导航系统的构建.利用Q强化学习算法对模糊规则中各行为的值函数进行在线增量学习,实现模糊决策的逐步求精.仿真实验表明,移动机器人导航系统能够在运行过程中不断调整导航策略,实现对未知不确定环境的自适应.同时由于导航先验知识的引入,有效地克服了强化学习初始阶段进行盲目搜索导致的学习速率低、收敛速度慢的缺点,实现了移动机器人可靠导航.
침대현유이동궤기인모호도항대미지불학정배경결핍자괄응성적결점,제출료일충구비재선자학습능력적모호도항방법.통과설계모호규칙병학정동작선험치,완성초시모호도항계통적구건.이용Q강화학습산법대모호규칙중각행위적치함수진행재선증량학습,실현모호결책적축보구정.방진실험표명,이동궤기인도항계통능구재운행과정중불단조정도항책략,실현대미지불학정배경적자괄응.동시유우도항선험지식적인입,유효지극복료강화학습초시계단진행맹목수색도치적학습속솔저、수렴속도만적결점,실현료이동궤기인가고도항.