计算机仿真
計算機倣真
계산궤방진
COMPUTER SIMULATION
2012年
9期
174-177
,共4页
模糊算法%加强学习%行为选择%决策
模糊算法%加彊學習%行為選擇%決策
모호산법%가강학습%행위선택%결책
研究足球机器人供过传球的成功率,优化控制策略,在机器人足球比赛中,针对现有行为选择策略因不能综合全面地考虑场上复杂的影响因素,造成传球、带球和射门的失误率较高的问题.为提高球员带球的准确率,提出了一种模糊Q学习的行为选择决策机制.利用模糊算法全面地处理和评估场上的干扰和影响因素,做出最佳行为决策.并通过Q学习算法来修正模糊规则.采用上述算法的行为选择策略,增强了策略对动态环境的适应能力.在机器人足球世界杯2D仿真平台上对策略进行了仿真验证,仿真结果表明改进算法能够很好的改善智能体的射门、传球和带球的成功率.
研究足毬機器人供過傳毬的成功率,優化控製策略,在機器人足毬比賽中,針對現有行為選擇策略因不能綜閤全麵地攷慮場上複雜的影響因素,造成傳毬、帶毬和射門的失誤率較高的問題.為提高毬員帶毬的準確率,提齣瞭一種模糊Q學習的行為選擇決策機製.利用模糊算法全麵地處理和評估場上的榦擾和影響因素,做齣最佳行為決策.併通過Q學習算法來脩正模糊規則.採用上述算法的行為選擇策略,增彊瞭策略對動態環境的適應能力.在機器人足毬世界杯2D倣真平檯上對策略進行瞭倣真驗證,倣真結果錶明改進算法能夠很好的改善智能體的射門、傳毬和帶毬的成功率.
연구족구궤기인공과전구적성공솔,우화공제책략,재궤기인족구비새중,침대현유행위선택책략인불능종합전면지고필장상복잡적영향인소,조성전구、대구화사문적실오솔교고적문제.위제고구원대구적준학솔,제출료일충모호Q학습적행위선택결책궤제.이용모호산법전면지처리화평고장상적간우화영향인소,주출최가행위결책.병통과Q학습산법래수정모호규칙.채용상술산법적행위선택책략,증강료책략대동태배경적괄응능력.재궤기인족구세계배2D방진평태상대책략진행료방진험증,방진결과표명개진산법능구흔호적개선지능체적사문、전구화대구적성공솔.