高技术通讯
高技術通訊
고기술통신
HIGH TECHNOLOGY LETTERS
2013年
4期
407-412
,共6页
强化学习(RL)%模糊小波神经网络(FWNN)%机器人足球比赛%动作选择%决策
彊化學習(RL)%模糊小波神經網絡(FWNN)%機器人足毬比賽%動作選擇%決策
강화학습(RL)%모호소파신경망락(FWNN)%궤기인족구비새%동작선택%결책
给出了一种基于模糊小波神经网络(FWNN)的强化学习方法,并研究了应用该方法解决多机器人足球比赛中的决策策略问题.首先,使用FWNN来实现强化学习状态空间到动作空间的映射,从而解决大规格或连续状态空间所导致的学习速度过慢甚至难以收敛等问题.然后,研究了提出的方法在机器人足球比赛的复杂决策策略学习中的应用,证明机器人球员能够通过学习掌握根据比赛状态信息选择合理动作的能力.最后,通过实验验证了该学习方法的有效性,它能够满足机器人足球比赛的需要.
給齣瞭一種基于模糊小波神經網絡(FWNN)的彊化學習方法,併研究瞭應用該方法解決多機器人足毬比賽中的決策策略問題.首先,使用FWNN來實現彊化學習狀態空間到動作空間的映射,從而解決大規格或連續狀態空間所導緻的學習速度過慢甚至難以收斂等問題.然後,研究瞭提齣的方法在機器人足毬比賽的複雜決策策略學習中的應用,證明機器人毬員能夠通過學習掌握根據比賽狀態信息選擇閤理動作的能力.最後,通過實驗驗證瞭該學習方法的有效性,它能夠滿足機器人足毬比賽的需要.
급출료일충기우모호소파신경망락(FWNN)적강화학습방법,병연구료응용해방법해결다궤기인족구비새중적결책책략문제.수선,사용FWNN래실현강화학습상태공간도동작공간적영사,종이해결대규격혹련속상태공간소도치적학습속도과만심지난이수렴등문제.연후,연구료제출적방법재궤기인족구비새적복잡결책책략학습중적응용,증명궤기인구원능구통과학습장악근거비새상태신식선택합리동작적능력.최후,통과실험험증료해학습방법적유효성,타능구만족궤기인족구비새적수요.