西安文理学院学报(自然科学版)
西安文理學院學報(自然科學版)
서안문이학원학보(자연과학판)
JOURNAL OF XI'AN UNIVERSITY OF ARTS AND SCIENCE (NATURAL SCIENCE EDITION)
2008年
2期
93-96
,共4页
分布式人工智能%多Agent系统%强化学习
分佈式人工智能%多Agent繫統%彊化學習
분포식인공지능%다Agent계통%강화학습
多Agent系统中的强化学习是近年发展起来的一种新的人工智能方法,是以单Agent强化学习Q-learning算法为基础的一种学习模型.由于现有的强化学习模型还存在着结构信度分配困难、学习速度慢等缺陷,这些缺陷大大限制了多Agent强化学习模型的应用范围.本文对多Agent强化学习模型进行了系统的研究,分析了多Agent理论中强化学习面临的任务,指出在多Agent系统顺序型任务中遇到的时间信度分配难题及多Agent系统Agent间"状态-动作"对Q值估计的互通问题,对此问题提出了初步的解决办法,并在此基础建立了一个改进的多Agent强化学习模型,而且把该模型应用于电磁辐射源识别工作中.
多Agent繫統中的彊化學習是近年髮展起來的一種新的人工智能方法,是以單Agent彊化學習Q-learning算法為基礎的一種學習模型.由于現有的彊化學習模型還存在著結構信度分配睏難、學習速度慢等缺陷,這些缺陷大大限製瞭多Agent彊化學習模型的應用範圍.本文對多Agent彊化學習模型進行瞭繫統的研究,分析瞭多Agent理論中彊化學習麵臨的任務,指齣在多Agent繫統順序型任務中遇到的時間信度分配難題及多Agent繫統Agent間"狀態-動作"對Q值估計的互通問題,對此問題提齣瞭初步的解決辦法,併在此基礎建立瞭一箇改進的多Agent彊化學習模型,而且把該模型應用于電磁輻射源識彆工作中.
다Agent계통중적강화학습시근년발전기래적일충신적인공지능방법,시이단Agent강화학습Q-learning산법위기출적일충학습모형.유우현유적강화학습모형환존재착결구신도분배곤난、학습속도만등결함,저사결함대대한제료다Agent강화학습모형적응용범위.본문대다Agent강화학습모형진행료계통적연구,분석료다Agent이론중강화학습면림적임무,지출재다Agent계통순서형임무중우도적시간신도분배난제급다Agent계통Agent간"상태-동작"대Q치고계적호통문제,대차문제제출료초보적해결판법,병재차기출건립료일개개진적다Agent강화학습모형,이차파해모형응용우전자복사원식별공작중.