电脑知识与技术
電腦知識與技術
전뇌지식여기술
COMPUTER KNOWLEDGE AND TECHNOLOGY
2011年
28期
6926-6927
,共2页
机器学习%TD算法%策略优化
機器學習%TD算法%策略優化
궤기학습%TD산법%책략우화
计算机乒乓游戏是出现在个人计算机上最早的游戏之一,该文利用强化学习中的TD算法,将状态的变化与得分的统计规律统计出来,就是研究在当前状态S下,球拍怎样移动获利最大,让机器击球手快速运动并准确击球.
計算機乒乓遊戲是齣現在箇人計算機上最早的遊戲之一,該文利用彊化學習中的TD算法,將狀態的變化與得分的統計規律統計齣來,就是研究在噹前狀態S下,毬拍怎樣移動穫利最大,讓機器擊毬手快速運動併準確擊毬.
계산궤핑퐁유희시출현재개인계산궤상최조적유희지일,해문이용강화학습중적TD산법,장상태적변화여득분적통계규률통계출래,취시연구재당전상태S하,구박즘양이동획리최대,양궤기격구수쾌속운동병준학격구.