信息技术
信息技術
신식기술
INFORMATION TECHNOLOGY
2012年
6期
100-103
,共4页
多机器人避碰%强化学习%神经网络
多機器人避踫%彊化學習%神經網絡
다궤기인피팽%강화학습%신경망락
采用强化学习解决多机器人避碰问题.然后针对表格式Q学习算法只能用于离散的状态并且学习时间过长,难以收敛的不足,提出了神经网络和Q学习相结合的算法.最后将该算法应用到多机器人避碰问题中,仿真实验表明该算法有效,能较好地解决多机器人避碰问题.
採用彊化學習解決多機器人避踫問題.然後針對錶格式Q學習算法隻能用于離散的狀態併且學習時間過長,難以收斂的不足,提齣瞭神經網絡和Q學習相結閤的算法.最後將該算法應用到多機器人避踫問題中,倣真實驗錶明該算法有效,能較好地解決多機器人避踫問題.
채용강화학습해결다궤기인피팽문제.연후침대표격식Q학습산법지능용우리산적상태병차학습시간과장,난이수렴적불족,제출료신경망락화Q학습상결합적산법.최후장해산법응용도다궤기인피팽문제중,방진실험표명해산법유효,능교호지해결다궤기인피팽문제.