浙江工业大学学报
浙江工業大學學報
절강공업대학학보
Journal of Zhejiang University of Technology
2010年
6期
655-660
,共6页
进化神经网络%强化学习%不确定环境%避障导航
進化神經網絡%彊化學習%不確定環境%避障導航
진화신경망락%강화학습%불학정배경%피장도항
神经网络的拓扑结构对网络的有效性起着十分重要的作用,网络建模中的主要困难就是如何有效地控制网络模型的结构进化趋势和复杂度.提出一种基于强化学习的进化神经网络(RLEANN),采用强化学习方法对网络进化群体与外界环境交互的效果进行评价,使其无需任何先验知识即可进行学习进化,通过强化信号的约束来控制网络群体的拓扑结构进化趋势.并在移动机器人避障导航仿真实验中证明,采用RL-EANN能使仿真机器人在不确定环境中快速有效地学习避障和接近目标,取得较好的导航效果,实践证明该方法的合理性和有效性.
神經網絡的拓撲結構對網絡的有效性起著十分重要的作用,網絡建模中的主要睏難就是如何有效地控製網絡模型的結構進化趨勢和複雜度.提齣一種基于彊化學習的進化神經網絡(RLEANN),採用彊化學習方法對網絡進化群體與外界環境交互的效果進行評價,使其無需任何先驗知識即可進行學習進化,通過彊化信號的約束來控製網絡群體的拓撲結構進化趨勢.併在移動機器人避障導航倣真實驗中證明,採用RL-EANN能使倣真機器人在不確定環境中快速有效地學習避障和接近目標,取得較好的導航效果,實踐證明該方法的閤理性和有效性.
신경망락적탁복결구대망락적유효성기착십분중요적작용,망락건모중적주요곤난취시여하유효지공제망락모형적결구진화추세화복잡도.제출일충기우강화학습적진화신경망락(RLEANN),채용강화학습방법대망락진화군체여외계배경교호적효과진행평개,사기무수임하선험지식즉가진행학습진화,통과강화신호적약속래공제망락군체적탁복결구진화추세.병재이동궤기인피장도항방진실험중증명,채용RL-EANN능사방진궤기인재불학정배경중쾌속유효지학습피장화접근목표,취득교호적도항효과,실천증명해방법적합이성화유효성.