CAJ | 학술논문

当前游戏中非玩家角色(Non-player Character,NPC)的行为主要基于随机决策或者传统的预定义行为决策,该方法的NPC不具有对游戏环境的自主学习能力.本文研究的目的是探索将强化学习方法应用于提高游戏NPC智能,使NPC在游戏过程中能实时地学习和适应演进的游戏环境,产生最合适的行为策略来响应玩家.本文提出一种动态训练强化学习的探索率参数方法,并将该方法应用于经典的Bomber Man游戏中.实验结果表明,该方法训练的NPC比非强化学习和传统强化学习训练的NPC具有更高的智能.
당전유희중비완가각색(Non-player Character,NPC)적행위주요기우수궤결책혹자전통적예정의행위결책,해방법적NPC불구유대유희배경적자주학습능력.본문연구적목적시탐색장강화학습방법응용우제고유희NPC지능,사NPC재유희과정중능실시지학습화괄응연진적유희배경,산생최합괄적행위책략래향응완가.본문제출일충동태훈련강화학습적탐색솔삼수방법,병장해방법응용우경전적Bomber Man유희중.실험결과표명,해방법훈련적NPC비비강화학습화전통강화학습훈련적NPC구유경고적지능.