自动化技术与应用
自動化技術與應用
자동화기술여응용
TECHNIQUES OF AUTOMATION AND APPLICATIONS
2006年
11期
10-12
,共3页
强化学习%Q-学习算法%智能体%经验知识
彊化學習%Q-學習算法%智能體%經驗知識
강화학습%Q-학습산법%지능체%경험지식
为了提高智能体系统中的典型的强化学习Q-学习的学习速度和收敛速度,使学习过程充分利用环境信息,本文提出了一种基于经验知识的Q-学习算法.该算法利用具有经验知识信息的函数,使智能体在进行无模型学习的同时学习系统模型,避免对环境模型的重复学习,从而加速智能体的学习速度.仿真实验结果表明:该算法使学习过程建立在较好的学习基础上,从而更快地趋近于最优状态,其学习效率和收敛速度明显优于标准的Q-学习.
為瞭提高智能體繫統中的典型的彊化學習Q-學習的學習速度和收斂速度,使學習過程充分利用環境信息,本文提齣瞭一種基于經驗知識的Q-學習算法.該算法利用具有經驗知識信息的函數,使智能體在進行無模型學習的同時學習繫統模型,避免對環境模型的重複學習,從而加速智能體的學習速度.倣真實驗結果錶明:該算法使學習過程建立在較好的學習基礎上,從而更快地趨近于最優狀態,其學習效率和收斂速度明顯優于標準的Q-學習.
위료제고지능체계통중적전형적강화학습Q-학습적학습속도화수렴속도,사학습과정충분이용배경신식,본문제출료일충기우경험지식적Q-학습산법.해산법이용구유경험지식신식적함수,사지능체재진행무모형학습적동시학습계통모형,피면대배경모형적중복학습,종이가속지능체적학습속도.방진실험결과표명:해산법사학습과정건립재교호적학습기출상,종이경쾌지추근우최우상태,기학습효솔화수렴속도명현우우표준적Q-학습.