计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2008年
19期
39-40,49
,共3页
分层强化学习%Option%蚁群聚类算法%经验回放
分層彊化學習%Option%蟻群聚類算法%經驗迴放
분층강화학습%Option%의군취류산법%경험회방
提出了一种新的分层强化学习(HRL)Option自动生成算法,以Agent在学习初始阶段探测到的状态空间为输入,并采用改进的蚁群聚类算法(ACCA)对其进行聚类,在聚类后的各状态子集上通过经验回放学习产生内部策略集,从而生成Option,仿真实验验证了该算法是有效的.
提齣瞭一種新的分層彊化學習(HRL)Option自動生成算法,以Agent在學習初始階段探測到的狀態空間為輸入,併採用改進的蟻群聚類算法(ACCA)對其進行聚類,在聚類後的各狀態子集上通過經驗迴放學習產生內部策略集,從而生成Option,倣真實驗驗證瞭該算法是有效的.
제출료일충신적분층강화학습(HRL)Option자동생성산법,이Agent재학습초시계단탐측도적상태공간위수입,병채용개진적의군취류산법(ACCA)대기진행취류,재취류후적각상태자집상통과경험회방학습산생내부책략집,종이생성Option,방진실험험증료해산법시유효적.