交通科学与工程
交通科學與工程
교통과학여공정
JOURNAL OF CHANGSHA COMMUNICATIONS UNIVERSRTY
2014年
1期
72-79
,共8页
交通工程%信号控制交叉口%定周期Q学习配时%不定周期Q学习配时
交通工程%信號控製交扠口%定週期Q學習配時%不定週期Q學習配時
교통공정%신호공제교차구%정주기Q학습배시%불정주기Q학습배시
traffic engineering%signalized intersection%Q learning model for fixed cycle timing%Q learning model for variable cycle timing
为了优化交叉口信号配时,通过集成Excel VBA-Vissim-Matlab的仿真平台,建立了以总关键排队长度之差最小为优化目标的单交叉口在线Q学习模型,包括定周期和不定周期两种模式的Q学习配时模型.针对控制性能指标相对于邻近的配时方案不敏感的特点,提出了以平均总关键排队长度之差作为基本单位重新构造奖励函数,目的是拉大各行为对应的Q值差距,提高模型的收敛速度和鲁棒性.通过算例,将定周期Q学习配时方案、不定周期Q学习配时方案与Transyt配时方案进行对比.研究结果表明:以总关键排队长度之差作为优化目标能够优化整个交叉口的时空资源,建立的在线Q学习模型具有较高的准确性、鲁棒性和学习能力,通过学习能够实现优化目标.同时,还探讨了流量变化情况下不定周期Q学习配时模型的性能.
為瞭優化交扠口信號配時,通過集成Excel VBA-Vissim-Matlab的倣真平檯,建立瞭以總關鍵排隊長度之差最小為優化目標的單交扠口在線Q學習模型,包括定週期和不定週期兩種模式的Q學習配時模型.針對控製性能指標相對于鄰近的配時方案不敏感的特點,提齣瞭以平均總關鍵排隊長度之差作為基本單位重新構造獎勵函數,目的是拉大各行為對應的Q值差距,提高模型的收斂速度和魯棒性.通過算例,將定週期Q學習配時方案、不定週期Q學習配時方案與Transyt配時方案進行對比.研究結果錶明:以總關鍵排隊長度之差作為優化目標能夠優化整箇交扠口的時空資源,建立的在線Q學習模型具有較高的準確性、魯棒性和學習能力,通過學習能夠實現優化目標.同時,還探討瞭流量變化情況下不定週期Q學習配時模型的性能.
위료우화교차구신호배시,통과집성Excel VBA-Vissim-Matlab적방진평태,건립료이총관건배대장도지차최소위우화목표적단교차구재선Q학습모형,포괄정주기화불정주기량충모식적Q학습배시모형.침대공제성능지표상대우린근적배시방안불민감적특점,제출료이평균총관건배대장도지차작위기본단위중신구조장려함수,목적시랍대각행위대응적Q치차거,제고모형적수렴속도화로봉성.통과산례,장정주기Q학습배시방안、불정주기Q학습배시방안여Transyt배시방안진행대비.연구결과표명:이총관건배대장도지차작위우화목표능구우화정개교차구적시공자원,건립적재선Q학습모형구유교고적준학성、로봉성화학습능력,통과학습능구실현우화목표.동시,환탐토료류량변화정황하불정주기Q학습배시모형적성능.