计算机与现代化
計算機與現代化
계산궤여현대화
COMPUTER AND MODERNIZATION
2010年
12期
25-26,29
,共3页
动态模糊集%Agent%强化学习%策略
動態模糊集%Agent%彊化學習%策略
동태모호집%Agent%강화학습%책략
主要讨论一种基于动态模糊集的Agent强化学习策略,介绍Agent强化学习的目标,状态值函数和动作值函数,马尔可夫决策过程的优化以及学习策略等.
主要討論一種基于動態模糊集的Agent彊化學習策略,介紹Agent彊化學習的目標,狀態值函數和動作值函數,馬爾可伕決策過程的優化以及學習策略等.
주요토론일충기우동태모호집적Agent강화학습책략,개소Agent강화학습적목표,상태치함수화동작치함수,마이가부결책과정적우화이급학습책략등.