小型微型计算机系统
小型微型計算機繫統
소형미형계산궤계통
MINI-MICRO SYSTEMS
2013年
11期
2599-2602
,共4页
陈卫东%关永贞%朱奇光%赵成龙
陳衛東%關永貞%硃奇光%趙成龍
진위동%관영정%주기광%조성룡
Sarsa(λ)学习%模糊强化学习算法%模糊推理系统%机器人导航
Sarsa(λ)學習%模糊彊化學習算法%模糊推理繫統%機器人導航
Sarsa(λ)학습%모호강화학습산법%모호추리계통%궤기인도항
Sarsa(λ)-learning%fuzzy reinforcement learning algorithm%fuzzy inference system%robot navigation
针对复杂未知环境下难以获得完善的模糊导航控制规则以及传统的强化学习算法不能解决连续状态空间和连续动作空间的学习问题,提出了一种模糊强化学习算法.通过将模糊推理系统和强化学习算法相结合,设计了一种模糊强化学习系统,一方面,在缺乏专家经验的情况下,利用强化学习中的Sarsa(λ)学习算法来获取模糊逻辑控制器的模糊规则库,另一方面,利用模糊推理系统所具有的广泛逼近性,使机器人在学习时可以遍历到每一个状态动作对.同时将有限的专家经验引入到模糊推理系统,使Sarsa(λ)学习具备一定的先验知识,从而加快学习速度.仿真实验表明,该方法具有较好的实时性和鲁棒性,能够有效解决移动机器人在未知复杂环境中的导航问题.
針對複雜未知環境下難以穫得完善的模糊導航控製規則以及傳統的彊化學習算法不能解決連續狀態空間和連續動作空間的學習問題,提齣瞭一種模糊彊化學習算法.通過將模糊推理繫統和彊化學習算法相結閤,設計瞭一種模糊彊化學習繫統,一方麵,在缺乏專傢經驗的情況下,利用彊化學習中的Sarsa(λ)學習算法來穫取模糊邏輯控製器的模糊規則庫,另一方麵,利用模糊推理繫統所具有的廣汎逼近性,使機器人在學習時可以遍歷到每一箇狀態動作對.同時將有限的專傢經驗引入到模糊推理繫統,使Sarsa(λ)學習具備一定的先驗知識,從而加快學習速度.倣真實驗錶明,該方法具有較好的實時性和魯棒性,能夠有效解決移動機器人在未知複雜環境中的導航問題.
침대복잡미지배경하난이획득완선적모호도항공제규칙이급전통적강화학습산법불능해결련속상태공간화련속동작공간적학습문제,제출료일충모호강화학습산법.통과장모호추리계통화강화학습산법상결합,설계료일충모호강화학습계통,일방면,재결핍전가경험적정황하,이용강화학습중적Sarsa(λ)학습산법래획취모호라집공제기적모호규칙고,령일방면,이용모호추리계통소구유적엄범핍근성,사궤기인재학습시가이편력도매일개상태동작대.동시장유한적전가경험인입도모호추리계통,사Sarsa(λ)학습구비일정적선험지식,종이가쾌학습속도.방진실험표명,해방법구유교호적실시성화로봉성,능구유효해결이동궤기인재미지복잡배경중적도항문제.