控制工程
控製工程
공제공정
CONTROL ENGINEERING OF CHINA
2012年
6期
987-992
,共6页
交通控制%信号配时%离线%学习%变周期
交通控製%信號配時%離線%學習%變週期
교통공제%신호배시%리선%학습%변주기
traffic control%signal timing%off-line%learning method%variable cycle
为提高交通控制系统的适应性和鲁棒性,采用强化学习方法实现交通控制模型的学习能力.对固定周期和变周期两种模式下的单交叉口信号配时优化进行研究,构造了等饱和度优化目标的奖赏函数,建立了等饱和度和延误最小两个优化目标的离线Q学习模型.采用对流量进行离散的方法解决了状态维数爆炸问题.通过算例对建立的4种离线Q学习模型解的结构、最优解的分布进行分析,结果表明相对于在线Q学习模型,离线Q学习模型更适合交叉口信号配时优化.采用“离线学习,在线应用”的方法,将建立的定周期延误最小离线Q学习模型与Webster定周期模型的性能进行对比,总体上前者的车均延误和累积延误低于后者.
為提高交通控製繫統的適應性和魯棒性,採用彊化學習方法實現交通控製模型的學習能力.對固定週期和變週期兩種模式下的單交扠口信號配時優化進行研究,構造瞭等飽和度優化目標的獎賞函數,建立瞭等飽和度和延誤最小兩箇優化目標的離線Q學習模型.採用對流量進行離散的方法解決瞭狀態維數爆炸問題.通過算例對建立的4種離線Q學習模型解的結構、最優解的分佈進行分析,結果錶明相對于在線Q學習模型,離線Q學習模型更適閤交扠口信號配時優化.採用“離線學習,在線應用”的方法,將建立的定週期延誤最小離線Q學習模型與Webster定週期模型的性能進行對比,總體上前者的車均延誤和纍積延誤低于後者.
위제고교통공제계통적괄응성화로봉성,채용강화학습방법실현교통공제모형적학습능력.대고정주기화변주기량충모식하적단교차구신호배시우화진행연구,구조료등포화도우화목표적장상함수,건립료등포화도화연오최소량개우화목표적리선Q학습모형.채용대류량진행리산적방법해결료상태유수폭작문제.통과산례대건립적4충리선Q학습모형해적결구、최우해적분포진행분석,결과표명상대우재선Q학습모형,리선Q학습모형경괄합교차구신호배시우화.채용“리선학습,재선응용”적방법,장건립적정주기연오최소리선Q학습모형여Webster정주기모형적성능진행대비,총체상전자적차균연오화루적연오저우후자.