智能计算机与应用
智能計算機與應用
지능계산궤여응용
Computer Study
2013年
3期
14-17
,共4页
柯文德%洪炳镕%崔刚%蔡则苏
柯文德%洪炳镕%崔剛%蔡則囌
가문덕%홍병용%최강%채칙소
多机器人%协作%分层学习%心智
多機器人%協作%分層學習%心智
다궤기인%협작%분층학습%심지
针对多机器人协作中存在的并发性较少、协商通信的实时性与高效性较差以及问题学习空间维数灾难等问题,提出一种基于π-MaxQ学习的多机器人主体协作方法.定义了机器人的公共知识、信念、目标、意图、承诺、信任、知识更新等心智状态,扩充了基于心智状态的KQML(Knowledge Query and Manipulation Language)通信原语,并基于MaxQ方法构建了联合奖励函数.实验证明了方法的有效性.
針對多機器人協作中存在的併髮性較少、協商通信的實時性與高效性較差以及問題學習空間維數災難等問題,提齣一種基于π-MaxQ學習的多機器人主體協作方法.定義瞭機器人的公共知識、信唸、目標、意圖、承諾、信任、知識更新等心智狀態,擴充瞭基于心智狀態的KQML(Knowledge Query and Manipulation Language)通信原語,併基于MaxQ方法構建瞭聯閤獎勵函數.實驗證明瞭方法的有效性.
침대다궤기인협작중존재적병발성교소、협상통신적실시성여고효성교차이급문제학습공간유수재난등문제,제출일충기우π-MaxQ학습적다궤기인주체협작방법.정의료궤기인적공공지식、신념、목표、의도、승낙、신임、지식경신등심지상태,확충료기우심지상태적KQML(Knowledge Query and Manipulation Language)통신원어,병기우MaxQ방법구건료연합장려함수.실험증명료방법적유효성.