CAJ | 학술논문

以Q学习为代表的传统强化学习方法都是维持一个状态与动作的映射表.这种状态-动作的二层映射结构缺乏灵活性,同时不能有效地使用先验知识引导学习过程.为了解决这一问题,提出了一种基于多动机强化学习(MMRL)的框架.MMRL框架在状态与动作间引入动机层,将原有的状态-动作二层结构扩展为状态-动机-动作三层结构,可根据经验设置多个动机.通过动机的设定实现了先验知识的利用,进而加快了强化学习的进程,提高了强化学习的灵活性.实验表明,通过合理的动机设定,多动机强化学习的学习速度较传统强化学习有明显提升.
이Q학습위대표적전통강화학습방법도시유지일개상태여동작적영사표.저충상태-동작적이층영사결구결핍령활성,동시불능유효지사용선험지식인도학습과정.위료해결저일문제,제출료일충기우다동궤강화학습(MMRL)적광가.MMRL광가재상태여동작간인입동궤층,장원유적상태-동작이층결구확전위상태-동궤-동작삼층결구,가근거경험설치다개동궤.통과동궤적설정실현료선험지식적이용,진이가쾌료강화학습적진정,제고료강화학습적령활성.실험표명,통과합리적동궤설정,다동궤강화학습적학습속도교전통강화학습유명현제승.