四川大学学报(自然科学版)
四川大學學報(自然科學版)
사천대학학보(자연과학판)
JOURNAL OF SICHUAN UNIVERSITY(NATURAL SCIENCE EDITION)
2014年
5期
915-920
,共6页
李炎武%陈渝%曾庆维%罗程%林涛
李炎武%陳渝%曾慶維%囉程%林濤
리염무%진투%증경유%라정%림도
游戏智能%强化学习%非玩家角色
遊戲智能%彊化學習%非玩傢角色
유희지능%강화학습%비완가각색
Game intelligence%Reinforcement learning%NPC
当前游戏中非玩家角色(Non-player Character,NPC)的行为主要基于随机决策或者传统的预定义行为决策,该方法的NPC不具有对游戏环境的自主学习能力.本文研究的目的是探索将强化学习方法应用于提高游戏NPC智能,使NPC在游戏过程中能实时地学习和适应演进的游戏环境,产生最合适的行为策略来响应玩家.本文提出一种动态训练强化学习的探索率参数方法,并将该方法应用于经典的Bomber Man游戏中.实验结果表明,该方法训练的NPC比非强化学习和传统强化学习训练的NPC具有更高的智能.
噹前遊戲中非玩傢角色(Non-player Character,NPC)的行為主要基于隨機決策或者傳統的預定義行為決策,該方法的NPC不具有對遊戲環境的自主學習能力.本文研究的目的是探索將彊化學習方法應用于提高遊戲NPC智能,使NPC在遊戲過程中能實時地學習和適應縯進的遊戲環境,產生最閤適的行為策略來響應玩傢.本文提齣一種動態訓練彊化學習的探索率參數方法,併將該方法應用于經典的Bomber Man遊戲中.實驗結果錶明,該方法訓練的NPC比非彊化學習和傳統彊化學習訓練的NPC具有更高的智能.
당전유희중비완가각색(Non-player Character,NPC)적행위주요기우수궤결책혹자전통적예정의행위결책,해방법적NPC불구유대유희배경적자주학습능력.본문연구적목적시탐색장강화학습방법응용우제고유희NPC지능,사NPC재유희과정중능실시지학습화괄응연진적유희배경,산생최합괄적행위책략래향응완가.본문제출일충동태훈련강화학습적탐색솔삼수방법,병장해방법응용우경전적Bomber Man유희중.실험결과표명,해방법훈련적NPC비비강화학습화전통강화학습훈련적NPC구유경고적지능.