CAJ | 학술논문

提出一种内在动机驱动下的基于FRBF(模糊径向基函数)网络结构的Actor-Critic学习算法.该算法在内在动机的驱动下,利用FRBF网络本身所具有的根据任务复杂度和学习进度对整体网络进行优化的特点,有效解决了通常情况下对值函数进行离散处理所造成的维数灾难问题,改善了系统的泛化能力和算法收敛速度.并在两轮机器人上做了仿真实验,结果表明,该算法能够使机器人通过与环境的交互学习,达到自主控制平衡的目的,体现了该算法的有效性.
제출일충내재동궤구동하적기우FRBF(모호경향기함수)망락결구적Actor-Critic학습산법.해산법재내재동궤적구동하,이용FRBF망락본신소구유적근거임무복잡도화학습진도대정체망락진행우화적특점,유효해결료통상정황하대치함수진행리산처리소조성적유수재난문제,개선료계통적범화능력화산법수렴속도.병재량륜궤기인상주료방진실험,결과표명,해산법능구사궤기인통과여배경적교호학습,체도자주공제평형적목적,체현료해산법적유효성.