西安工业大学学报
西安工業大學學報
서안공업대학학보
JOURNAL OF XI'AN TECHNOLOGICAL UNIVERSITY
2007年
4期
325-329
,共5页
机器人导航%模糊逻辑%在线自学习%Q强化学习
機器人導航%模糊邏輯%在線自學習%Q彊化學習
궤기인도항%모호라집%재선자학습%Q강화학습
针对现有移动机器人模糊导航对未知不确定环境缺乏自适应性的缺点,提出了一种具备在线自学习能力的模糊导航方法.通过设计模糊规则并确定动作先验值,完成初始模糊导航系统的构建.利用Q强化学习算法对模糊规则中各行为的值函数进行在线增量学习,实现模糊决策的逐步求精.仿真实验表明,移动机器人导航系统能够在运行过程中不断调整导航策略,实现对未知不确定环境的自适应.同时由于导航先验知识的引入,有效地克服了强化学习初始阶段进行盲目搜索导致的学习速率低、收敛速度慢的缺点,实现了移动机器人可靠导航.
針對現有移動機器人模糊導航對未知不確定環境缺乏自適應性的缺點,提齣瞭一種具備在線自學習能力的模糊導航方法.通過設計模糊規則併確定動作先驗值,完成初始模糊導航繫統的構建.利用Q彊化學習算法對模糊規則中各行為的值函數進行在線增量學習,實現模糊決策的逐步求精.倣真實驗錶明,移動機器人導航繫統能夠在運行過程中不斷調整導航策略,實現對未知不確定環境的自適應.同時由于導航先驗知識的引入,有效地剋服瞭彊化學習初始階段進行盲目搜索導緻的學習速率低、收斂速度慢的缺點,實現瞭移動機器人可靠導航.
침대현유이동궤기인모호도항대미지불학정배경결핍자괄응성적결점,제출료일충구비재선자학습능력적모호도항방법.통과설계모호규칙병학정동작선험치,완성초시모호도항계통적구건.이용Q강화학습산법대모호규칙중각행위적치함수진행재선증량학습,실현모호결책적축보구정.방진실험표명,이동궤기인도항계통능구재운행과정중불단조정도항책략,실현대미지불학정배경적자괄응.동시유우도항선험지식적인입,유효지극복료강화학습초시계단진행맹목수색도치적학습속솔저、수렴속도만적결점,실현료이동궤기인가고도항.