计算机应用与软件
計算機應用與軟件
계산궤응용여연건
COMPUTER APPLICATIONS AND SOFTWARE
2009年
7期
37-38,42
,共3页
王建国%梁松阳%张洋%孟祥甫
王建國%樑鬆暘%張洋%孟祥甫
왕건국%량송양%장양%맹상보
机器人足球%角色分配%投票机制%Q学习
機器人足毬%角色分配%投票機製%Q學習
궤기인족구%각색분배%투표궤제%Q학습
针对在Robocup中型四人组机器人足球比赛中,原有的投票机制在进行角色分配时产生的系统震荡问题和系统反应不灵敏问题,提出用动态权值的投票机制进行解决.由于投票函数的设定有很大的人为因素,而强化学习在与环境的交互时的试错可能给系统带来风险损失,因此把动态权值的投票机制与Q学习相结合应用于角色分配.通过仿真验证了方法的有效性.
針對在Robocup中型四人組機器人足毬比賽中,原有的投票機製在進行角色分配時產生的繫統震盪問題和繫統反應不靈敏問題,提齣用動態權值的投票機製進行解決.由于投票函數的設定有很大的人為因素,而彊化學習在與環境的交互時的試錯可能給繫統帶來風險損失,因此把動態權值的投票機製與Q學習相結閤應用于角色分配.通過倣真驗證瞭方法的有效性.
침대재Robocup중형사인조궤기인족구비새중,원유적투표궤제재진행각색분배시산생적계통진탕문제화계통반응불령민문제,제출용동태권치적투표궤제진행해결.유우투표함수적설정유흔대적인위인소,이강화학습재여배경적교호시적시착가능급계통대래풍험손실,인차파동태권치적투표궤제여Q학습상결합응용우각색분배.통과방진험증료방법적유효성.