计算机科学
計算機科學
계산궤과학
COMPUTER SCIENCE
2007年
10期
1-7,23
,共8页
王蓁蓁%邢汉承%张志政%倪庆剑
王蓁蓁%邢漢承%張誌政%倪慶劍
왕진진%형한승%장지정%예경검
逻辑马尔可夫决策过程%关系马尔可夫决策过程
邏輯馬爾可伕決策過程%關繫馬爾可伕決策過程
라집마이가부결책과정%관계마이가부결책과정
逻辑马尔可夫决策过程和关系马尔可夫决策过程的引入,使得人们可能简洁地、陈述地表达复杂的马尔可夫决策过程.本文首先介绍有关逻辑马尔可夫决策过程和关系马尔可夫决策过程的概念,然后重点介绍它们与普通的马尔可夫决策过程根本不同的一些算法:①依赖于基本状态空间RL的转换法;②把Bellmanan方程推广到抽象状态空间的方法;③利用策略偏置空间寻求近似最优策略方法.最后对它们的研究现状进行总结及其对它们发展的一些展望.
邏輯馬爾可伕決策過程和關繫馬爾可伕決策過程的引入,使得人們可能簡潔地、陳述地錶達複雜的馬爾可伕決策過程.本文首先介紹有關邏輯馬爾可伕決策過程和關繫馬爾可伕決策過程的概唸,然後重點介紹它們與普通的馬爾可伕決策過程根本不同的一些算法:①依賴于基本狀態空間RL的轉換法;②把Bellmanan方程推廣到抽象狀態空間的方法;③利用策略偏置空間尋求近似最優策略方法.最後對它們的研究現狀進行總結及其對它們髮展的一些展望.
라집마이가부결책과정화관계마이가부결책과정적인입,사득인문가능간길지、진술지표체복잡적마이가부결책과정.본문수선개소유관라집마이가부결책과정화관계마이가부결책과정적개념,연후중점개소타문여보통적마이가부결책과정근본불동적일사산법:①의뢰우기본상태공간RL적전환법;②파Bellmanan방정추엄도추상상태공간적방법;③이용책략편치공간심구근사최우책략방법.최후대타문적연구현상진행총결급기대타문발전적일사전망.