模式识别与人工智能
模式識彆與人工智能
모식식별여인공지능
Moshi Shibie yu Rengong Zhineng
2007年
2期
236-240
,共5页
递阶再励学习%Option%探索密度(ED)
遞階再勵學習%Option%探索密度(ED)
체계재려학습%Option%탐색밀도(ED)
提出状态探索密度的概念,通过检测状态对智能体探索环境能力的影响来发现学习的子目标并构建对应的Option.用该算法创建Option的再励学习算法能有效提高学习速度.算法具有和任务无关、不需要先验知识等优点,构造出的Option在同一环境下不同任务间可以直接共享.
提齣狀態探索密度的概唸,通過檢測狀態對智能體探索環境能力的影響來髮現學習的子目標併構建對應的Option.用該算法創建Option的再勵學習算法能有效提高學習速度.算法具有和任務無關、不需要先驗知識等優點,構造齣的Option在同一環境下不同任務間可以直接共享.
제출상태탐색밀도적개념,통과검측상태대지능체탐색배경능력적영향래발현학습적자목표병구건대응적Option.용해산법창건Option적재려학습산법능유효제고학습속도.산법구유화임무무관、불수요선험지식등우점,구조출적Option재동일배경하불동임무간가이직접공향.