北京理工大学学报
北京理工大學學報
북경리공대학학보
JOURNAL OF BEIJING INSTITUTE OF TECHNOLOGY
2004年
5期
403-406,415
,共5页
多机器人%围捕%状态聚类%Q学习
多機器人%圍捕%狀態聚類%Q學習
다궤기인%위포%상태취류%Q학습
提出一种在连续未知环境中实现多移动机器人协作围捕移动目标的整体方案.围捕包括包围目标和靠近目标,包围目标行为由强化学习算法实现.用状态聚类减小状态空间,利用Q学习算法获得Q值表,根据学习后的Q值表选择动作.对各种行为的输出进行加权求和获得综合行为,实现对移动目标的围捕.仿真实验获得了在不同条件下的围捕结果.结果表明,环境、hunter与prey的速度关系以及prey的逃跑策略对围捕效果都有影响.
提齣一種在連續未知環境中實現多移動機器人協作圍捕移動目標的整體方案.圍捕包括包圍目標和靠近目標,包圍目標行為由彊化學習算法實現.用狀態聚類減小狀態空間,利用Q學習算法穫得Q值錶,根據學習後的Q值錶選擇動作.對各種行為的輸齣進行加權求和穫得綜閤行為,實現對移動目標的圍捕.倣真實驗穫得瞭在不同條件下的圍捕結果.結果錶明,環境、hunter與prey的速度關繫以及prey的逃跑策略對圍捕效果都有影響.
제출일충재련속미지배경중실현다이동궤기인협작위포이동목표적정체방안.위포포괄포위목표화고근목표,포위목표행위유강화학습산법실현.용상태취류감소상태공간,이용Q학습산법획득Q치표,근거학습후적Q치표선택동작.대각충행위적수출진행가권구화획득종합행위,실현대이동목표적위포.방진실험획득료재불동조건하적위포결과.결과표명,배경、hunter여prey적속도관계이급prey적도포책략대위포효과도유영향.