长沙大学学报
長沙大學學報
장사대학학보
JOURNAL OF CHANGSHA UNIVERSITY
2014年
5期
70-74
,共5页
配时优化%绿灯时间等饱和度%TD方法%状态模糊%变周期
配時優化%綠燈時間等飽和度%TD方法%狀態模糊%變週期
배시우화%록등시간등포화도%TD방법%상태모호%변주기
timing optimization%green time equi-saturation%TD control%state fuzzy%variable cycle
首先对传统的绿灯时间等饱和度概念进行了扩展,提出了分级绿灯时间等饱和度。在此基础上,针对分级绿灯时间等饱和度目标,构造了奖赏函数,采用了模糊方法解决流量状态空间维数爆炸问题,建立了定周期和变周期两种模式下的四种离线TD学习配时优化模型。通过Matlab编程,开发了这四种模型的计算程序,相对于在线TD学习模型,离线TD学习模型更适合交叉口信号配时优化。以一个两相位控制的单交叉口配时优化作为算例,对比分析了四种模型的性能。总体上变周期模式的离线TD学习模型可以获得解的结构、最优解的分布,这是传统配时理论不具备的。定周期条件下,奖赏分级的效果不明显;变周期条件下,奖赏分级效果明显,交通性能更优。
首先對傳統的綠燈時間等飽和度概唸進行瞭擴展,提齣瞭分級綠燈時間等飽和度。在此基礎上,針對分級綠燈時間等飽和度目標,構造瞭獎賞函數,採用瞭模糊方法解決流量狀態空間維數爆炸問題,建立瞭定週期和變週期兩種模式下的四種離線TD學習配時優化模型。通過Matlab編程,開髮瞭這四種模型的計算程序,相對于在線TD學習模型,離線TD學習模型更適閤交扠口信號配時優化。以一箇兩相位控製的單交扠口配時優化作為算例,對比分析瞭四種模型的性能。總體上變週期模式的離線TD學習模型可以穫得解的結構、最優解的分佈,這是傳統配時理論不具備的。定週期條件下,獎賞分級的效果不明顯;變週期條件下,獎賞分級效果明顯,交通性能更優。
수선대전통적록등시간등포화도개념진행료확전,제출료분급록등시간등포화도。재차기출상,침대분급록등시간등포화도목표,구조료장상함수,채용료모호방법해결류량상태공간유수폭작문제,건립료정주기화변주기량충모식하적사충리선TD학습배시우화모형。통과Matlab편정,개발료저사충모형적계산정서,상대우재선TD학습모형,리선TD학습모형경괄합교차구신호배시우화。이일개량상위공제적단교차구배시우화작위산례,대비분석료사충모형적성능。총체상변주기모식적리선TD학습모형가이획득해적결구、최우해적분포,저시전통배시이론불구비적。정주기조건하,장상분급적효과불명현;변주기조건하,장상분급효과명현,교통성능경우。
We propose the multi-level green time saturation.On this basis,for the classification of green time saturation target,the study constructs a reward function,uses the fuzzy method to solve the traffic state space dimension explosion problem,and establishes four optimization models of offline TD learning under fixed period and variable cycle two modes.Using a two-phase control of a single intersection as an example,the study comparatively analyzes the performance of four models.Generally speaking,offline TD learning model of variable cycle mode can obtain the structure of solutions and the optimal solutions distribution,which does not belong to the traditional timing theory.Under the fixed period condition,reward grading effect is not obvious,while under the variable cycle condi-tion,reward grading effect is obvious and the traffic has better performance.