河北联合大学学报(自然科学版)
河北聯閤大學學報(自然科學版)
하북연합대학학보(자연과학판)
Journal of Hebei United university natural sclence edition
2015年
3期
88-94
,共7页
内在动机%FRBF网络%强化学习%Actor-Critic算法%自主学习
內在動機%FRBF網絡%彊化學習%Actor-Critic算法%自主學習
내재동궤%FRBF망락%강화학습%Actor-Critic산법%자주학습
提出一种内在动机驱动下的基于FRBF(模糊径向基函数)网络结构的Actor-Critic学习算法.该算法在内在动机的驱动下,利用FRBF网络本身所具有的根据任务复杂度和学习进度对整体网络进行优化的特点,有效解决了通常情况下对值函数进行离散处理所造成的维数灾难问题,改善了系统的泛化能力和算法收敛速度.并在两轮机器人上做了仿真实验,结果表明,该算法能够使机器人通过与环境的交互学习,达到自主控制平衡的目的,体现了该算法的有效性.
提齣一種內在動機驅動下的基于FRBF(模糊徑嚮基函數)網絡結構的Actor-Critic學習算法.該算法在內在動機的驅動下,利用FRBF網絡本身所具有的根據任務複雜度和學習進度對整體網絡進行優化的特點,有效解決瞭通常情況下對值函數進行離散處理所造成的維數災難問題,改善瞭繫統的汎化能力和算法收斂速度.併在兩輪機器人上做瞭倣真實驗,結果錶明,該算法能夠使機器人通過與環境的交互學習,達到自主控製平衡的目的,體現瞭該算法的有效性.
제출일충내재동궤구동하적기우FRBF(모호경향기함수)망락결구적Actor-Critic학습산법.해산법재내재동궤적구동하,이용FRBF망락본신소구유적근거임무복잡도화학습진도대정체망락진행우화적특점,유효해결료통상정황하대치함수진행리산처리소조성적유수재난문제,개선료계통적범화능력화산법수렴속도.병재량륜궤기인상주료방진실험,결과표명,해산법능구사궤기인통과여배경적교호학습,체도자주공제평형적목적,체현료해산법적유효성.