电脑知识与技术
電腦知識與技術
전뇌지식여기술
COMPUTER KNOWLEDGE AND TECHNOLOGY
2012年
28期
6782-6786
,共5页
强化学习%神经网络%马尔科夫决策过程%算法%应用
彊化學習%神經網絡%馬爾科伕決策過程%算法%應用
강화학습%신경망락%마이과부결책과정%산법%응용
随着强化学习的日益发展,研究越来越深入,将神经网络引入强化学习的研究中已经成为热点课题之一.本文首先介绍强化学习的定义、原理及一般结构,接着简单表述神经网络的基本内容和马尔科夫决策过程模型;然后将强化学习和神经网络融合,重点介绍了两种常见的学习算法,算法都是改进过并且融合了神经网络的特性;最后,简单介绍该方式的强化学习在人工智能,控制系统,游戏以及优化调度等领域的应用情况.
隨著彊化學習的日益髮展,研究越來越深入,將神經網絡引入彊化學習的研究中已經成為熱點課題之一.本文首先介紹彊化學習的定義、原理及一般結構,接著簡單錶述神經網絡的基本內容和馬爾科伕決策過程模型;然後將彊化學習和神經網絡融閤,重點介紹瞭兩種常見的學習算法,算法都是改進過併且融閤瞭神經網絡的特性;最後,簡單介紹該方式的彊化學習在人工智能,控製繫統,遊戲以及優化調度等領域的應用情況.
수착강화학습적일익발전,연구월래월심입,장신경망락인입강화학습적연구중이경성위열점과제지일.본문수선개소강화학습적정의、원리급일반결구,접착간단표술신경망락적기본내용화마이과부결책과정모형;연후장강화학습화신경망락융합,중점개소료량충상견적학습산법,산법도시개진과병차융합료신경망락적특성;최후,간단개소해방식적강화학습재인공지능,공제계통,유희이급우화조도등영역적응용정황.