CAJ | 학술논문

为了优化交叉口信号配时,通过集成Excel VBA-Vissim-Matlab的仿真平台,建立了以总关键排队长度之差最小为优化目标的单交叉口在线Q学习模型,包括定周期和不定周期两种模式的Q学习配时模型.针对控制性能指标相对于邻近的配时方案不敏感的特点,提出了以平均总关键排队长度之差作为基本单位重新构造奖励函数,目的是拉大各行为对应的Q值差距,提高模型的收敛速度和鲁棒性.通过算例,将定周期Q学习配时方案、不定周期Q学习配时方案与Transyt配时方案进行对比.研究结果表明:以总关键排队长度之差作为优化目标能够优化整个交叉口的时空资源,建立的在线Q学习模型具有较高的准确性、鲁棒性和学习能力,通过学习能够实现优化目标.同时,还探讨了流量变化情况下不定周期Q学习配时模型的性能.
위료우화교차구신호배시,통과집성Excel VBA-Vissim-Matlab적방진평태,건립료이총관건배대장도지차최소위우화목표적단교차구재선Q학습모형,포괄정주기화불정주기량충모식적Q학습배시모형.침대공제성능지표상대우린근적배시방안불민감적특점,제출료이평균총관건배대장도지차작위기본단위중신구조장려함수,목적시랍대각행위대응적Q치차거,제고모형적수렴속도화로봉성.통과산례,장정주기Q학습배시방안、불정주기Q학습배시방안여Transyt배시방안진행대비.연구결과표명:이총관건배대장도지차작위우화목표능구우화정개교차구적시공자원,건립적재선Q학습모형구유교고적준학성、로봉성화학습능력,통과학습능구실현우화목표.동시,환탐토료류량변화정황하불정주기Q학습배시모형적성능.