武汉理工大学学报(交通科学与工程版)
武漢理工大學學報(交通科學與工程版)
무한리공대학학보(교통과학여공정판)
JOURNAL OF WUHAN UNIVERSITY OF TECHNOLOGY(TRANSPORTATION SCIENCE & ENGINEERING)
2013年
4期
771-774,779
,共5页
交叉口%学习%博弈论
交扠口%學習%博弈論
교차구%학습%박혁론
intersection%learning%game
针对路网中交叉口之间交通流的关联性、动态性及不确定性,应用了信号博弈作为交叉口交通信号控制agent (TSCA)间协调的模型,以分布式Q强化学习中Q值更新来进行其效用函数的学习,通过引入记忆因子对奖惩函数进行设计,及相邻交叉口之间的影响建立权值函数,构建了协调学习的仿真实现流程,并通过实验仿真验证此模型的有效性.
針對路網中交扠口之間交通流的關聯性、動態性及不確定性,應用瞭信號博弈作為交扠口交通信號控製agent (TSCA)間協調的模型,以分佈式Q彊化學習中Q值更新來進行其效用函數的學習,通過引入記憶因子對獎懲函數進行設計,及相鄰交扠口之間的影響建立權值函數,構建瞭協調學習的倣真實現流程,併通過實驗倣真驗證此模型的有效性.
침대로망중교차구지간교통류적관련성、동태성급불학정성,응용료신호박혁작위교차구교통신호공제agent (TSCA)간협조적모형,이분포식Q강화학습중Q치경신래진행기효용함수적학습,통과인입기억인자대장징함수진행설계,급상린교차구지간적영향건립권치함수,구건료협조학습적방진실현류정,병통과실험방진험증차모형적유효성.