电脑知识与技术
電腦知識與技術
전뇌지식여기술
COMPUTER KNOWLEDGE AND TECHNOLOGY
2008年
15期
1094-1095
,共2页
强化学习%马尔可夫决策过程%Q-学习%多智能系统
彊化學習%馬爾可伕決策過程%Q-學習%多智能繫統
강화학습%마이가부결책과정%Q-학습%다지능계통
强化学习通过试错与环境交互获得策略的改进,其自学习和在线学习的特点使其成为机器学习研究的一个重要分支,该文首先介绍了强化学习的基本原理结构和各种算法;然后介绍了近年来强化学习的应用等热点问题.
彊化學習通過試錯與環境交互穫得策略的改進,其自學習和在線學習的特點使其成為機器學習研究的一箇重要分支,該文首先介紹瞭彊化學習的基本原理結構和各種算法;然後介紹瞭近年來彊化學習的應用等熱點問題.
강화학습통과시착여배경교호획득책략적개진,기자학습화재선학습적특점사기성위궤기학습연구적일개중요분지,해문수선개소료강화학습적기본원리결구화각충산법;연후개소료근년래강화학습적응용등열점문제.