CAJ | 학술논문

为了提高智能体系统中的典型的强化学习Q-学习的学习速度和收敛速度,使学习过程充分利用环境信息,本文提出了一种基于经验知识的Q-学习算法.该算法利用具有经验知识信息的函数,使智能体在进行无模型学习的同时学习系统模型,避免对环境模型的重复学习,从而加速智能体的学习速度.仿真实验结果表明:该算法使学习过程建立在较好的学习基础上,从而更快地趋近于最优状态,其学习效率和收敛速度明显优于标准的Q-学习.
위료제고지능체계통중적전형적강화학습Q-학습적학습속도화수렴속도,사학습과정충분이용배경신식,본문제출료일충기우경험지식적Q-학습산법.해산법이용구유경험지식신식적함수,사지능체재진행무모형학습적동시학습계통모형,피면대배경모형적중복학습,종이가속지능체적학습속도.방진실험결과표명:해산법사학습과정건립재교호적학습기출상,종이경쾌지추근우최우상태,기학습효솔화수렴속도명현우우표준적Q-학습.