广西工学院学报
廣西工學院學報
엄서공학원학보
JOURNAL OF GUANGXI UNIVERSITY OF TECHNOLOGY
2011年
2期
1-5,15
,共6页
李春贵%周坚和%孙自广%王萌%张增芳
李春貴%週堅和%孫自廣%王萌%張增芳
리춘귀%주견화%손자엄%왕맹%장증방
多智能体团队学习%交通信号控制%强化学习%值函数近似%径向基函数神经网络
多智能體糰隊學習%交通信號控製%彊化學習%值函數近似%徑嚮基函數神經網絡
다지능체단대학습%교통신호공제%강화학습%치함수근사%경향기함수신경망락
城市的区域交通信号协调系统是一个十分复杂的系统,难以建立准确的数学模型,通过引入主-从式团队强化学习方法于区域交通信号协调控制,就可以根据实时的交通状态信息动态来进行决策,自动地适应环境以便取得更好的控制效果.由于问题状态空间太大且难以直接存储和表示,采用径向基函数神经网络进行值函数近似.通过训练自适应非线性处理单元,达到较好的近似表示效果,解决了多个交叉路口的交通信号协调控制问题.通过仿真实验,结果表明该方法的控制效果明显优于单点控制策略.
城市的區域交通信號協調繫統是一箇十分複雜的繫統,難以建立準確的數學模型,通過引入主-從式糰隊彊化學習方法于區域交通信號協調控製,就可以根據實時的交通狀態信息動態來進行決策,自動地適應環境以便取得更好的控製效果.由于問題狀態空間太大且難以直接存儲和錶示,採用徑嚮基函數神經網絡進行值函數近似.通過訓練自適應非線性處理單元,達到較好的近似錶示效果,解決瞭多箇交扠路口的交通信號協調控製問題.通過倣真實驗,結果錶明該方法的控製效果明顯優于單點控製策略.
성시적구역교통신호협조계통시일개십분복잡적계통,난이건립준학적수학모형,통과인입주-종식단대강화학습방법우구역교통신호협조공제,취가이근거실시적교통상태신식동태래진행결책,자동지괄응배경이편취득경호적공제효과.유우문제상태공간태대차난이직접존저화표시,채용경향기함수신경망락진행치함수근사.통과훈련자괄응비선성처리단원,체도교호적근사표시효과,해결료다개교차로구적교통신호협조공제문제.통과방진실험,결과표명해방법적공제효과명현우우단점공제책략.