CAJ | 학술논문

提出一种在连续未知环境中实现多移动机器人协作围捕移动目标的整体方案.围捕包括包围目标和靠近目标,包围目标行为由强化学习算法实现.用状态聚类减小状态空间,利用Q学习算法获得Q值表,根据学习后的Q值表选择动作.对各种行为的输出进行加权求和获得综合行为,实现对移动目标的围捕.仿真实验获得了在不同条件下的围捕结果.结果表明,环境、hunter与prey的速度关系以及prey的逃跑策略对围捕效果都有影响.
제출일충재련속미지배경중실현다이동궤기인협작위포이동목표적정체방안.위포포괄포위목표화고근목표,포위목표행위유강화학습산법실현.용상태취류감소상태공간,이용Q학습산법획득Q치표,근거학습후적Q치표선택동작.대각충행위적수출진행가권구화획득종합행위,실현대이동목표적위포.방진실험획득료재불동조건하적위포결과.결과표명,배경、hunter여prey적속도관계이급prey적도포책략대위포효과도유영향.