计算机工程与科学
計算機工程與科學
계산궤공정여과학
COMPUTER ENGINEERING & SCIENCE
2011年
6期
118-124
,共7页
强化学习%定性模型%知识传递
彊化學習%定性模型%知識傳遞
강화학습%정성모형%지식전체
本文提出一种基于定性模糊网络的强化学习知识传递方法.该方法通过建立系统的定性模型,并用定性模糊网络抽取基于定性动作的次优策略的共同特征获得与系统参数无关知识.这些知识能有效描述参数值不同的系统所具有的共同控制规律,加快在新参数值的系统中强化学习的收敛速度.
本文提齣一種基于定性模糊網絡的彊化學習知識傳遞方法.該方法通過建立繫統的定性模型,併用定性模糊網絡抽取基于定性動作的次優策略的共同特徵穫得與繫統參數無關知識.這些知識能有效描述參數值不同的繫統所具有的共同控製規律,加快在新參數值的繫統中彊化學習的收斂速度.
본문제출일충기우정성모호망락적강화학습지식전체방법.해방법통과건립계통적정성모형,병용정성모호망락추취기우정성동작적차우책략적공동특정획득여계통삼수무관지식.저사지식능유효묘술삼수치불동적계통소구유적공동공제규률,가쾌재신삼수치적계통중강화학습적수렴속도.