河南师范大学学报(自然科学版)
河南師範大學學報(自然科學版)
하남사범대학학보(자연과학판)
JOURNAL OF HENAN NORMAL UNIVERSITY(NATURAL SCIENCE)
2013年
2期
158-160
,共3页
多Agent%强化学习%Q值学习
多Agent%彊化學習%Q值學習
다Agent%강화학습%Q치학습
对多Agent系统的Q值强化学习算法进行研究,将历史信息因素的影响添加到Q值学习中,提出了一个新的基于多Agent系统的Q值学习算法.该算法在保证多Agent系统利益达到相对最大化的同时,也有效降低了Agent之间的冲突率.最后,通过仿真测试验证了该算法的有效性.
對多Agent繫統的Q值彊化學習算法進行研究,將歷史信息因素的影響添加到Q值學習中,提齣瞭一箇新的基于多Agent繫統的Q值學習算法.該算法在保證多Agent繫統利益達到相對最大化的同時,也有效降低瞭Agent之間的遲突率.最後,通過倣真測試驗證瞭該算法的有效性.
대다Agent계통적Q치강화학습산법진행연구,장역사신식인소적영향첨가도Q치학습중,제출료일개신적기우다Agent계통적Q치학습산법.해산법재보증다Agent계통이익체도상대최대화적동시,야유효강저료Agent지간적충돌솔.최후,통과방진측시험증료해산법적유효성.