计算机研究与发展
計算機研究與髮展
계산궤연구여발전
JOURNAL OF COMPUTER RESEARCH AND DEVELOPMENT
2010年
5期
948-955
,共8页
邵杰%杨静宇%万鸣华%黄传波
邵傑%楊靜宇%萬鳴華%黃傳波
소걸%양정우%만명화%황전파
路径规划%多机器人%学习分类器%收敛性%适应度函数
路徑規劃%多機器人%學習分類器%收斂性%適應度函數
로경규화%다궤기인%학습분류기%수렴성%괄응도함수
近年来,学习分类器LCS已广泛用于基于归纳学习的强化学习领域,但很少用于多机器人领域.提出了一种基于集成强化学习和遗传算法的学习分类器用于多机器人路径规划领域.由于遗传算法具有早熟收敛、局部最优解和占据较大的存储空间等缺陷,针对静态和动态环境因素对多机器人路径规划的不同影响,设计了在静态和动态环境下不同的适应度函数,在理论上推导并证明了信用分配算法的收敛性,为路径规划算法的收敛提供了理论保证.仿真实验结果也表明遗传算法和学习分类器结合用于多机器人的路径规划是有效的,遗传算法的早熟收敛、局部最优解、占据存储空间较大和收敛速度慢等难题得到很大改善,提高了多机器人发现安全路径的能力.所以LCS在机器人领域的应用前景是非常广阔的,是今后需要努力研究的方向.
近年來,學習分類器LCS已廣汎用于基于歸納學習的彊化學習領域,但很少用于多機器人領域.提齣瞭一種基于集成彊化學習和遺傳算法的學習分類器用于多機器人路徑規劃領域.由于遺傳算法具有早熟收斂、跼部最優解和佔據較大的存儲空間等缺陷,針對靜態和動態環境因素對多機器人路徑規劃的不同影響,設計瞭在靜態和動態環境下不同的適應度函數,在理論上推導併證明瞭信用分配算法的收斂性,為路徑規劃算法的收斂提供瞭理論保證.倣真實驗結果也錶明遺傳算法和學習分類器結閤用于多機器人的路徑規劃是有效的,遺傳算法的早熟收斂、跼部最優解、佔據存儲空間較大和收斂速度慢等難題得到很大改善,提高瞭多機器人髮現安全路徑的能力.所以LCS在機器人領域的應用前景是非常廣闊的,是今後需要努力研究的方嚮.
근년래,학습분류기LCS이엄범용우기우귀납학습적강화학습영역,단흔소용우다궤기인영역.제출료일충기우집성강화학습화유전산법적학습분류기용우다궤기인로경규화영역.유우유전산법구유조숙수렴、국부최우해화점거교대적존저공간등결함,침대정태화동태배경인소대다궤기인로경규화적불동영향,설계료재정태화동태배경하불동적괄응도함수,재이론상추도병증명료신용분배산법적수렴성,위로경규화산법적수렴제공료이론보증.방진실험결과야표명유전산법화학습분류기결합용우다궤기인적로경규화시유효적,유전산법적조숙수렴、국부최우해、점거존저공간교대화수렴속도만등난제득도흔대개선,제고료다궤기인발현안전로경적능력.소이LCS재궤기인영역적응용전경시비상엄활적,시금후수요노력연구적방향.